Andy Melnikov (nponeccop) wrote,
Andy Melnikov
nponeccop

Categories:

Выебудни

Обнаружился гейзенбаг в коде. MPI_Waitany failed :( Причем вылетает примерно на третьем часу работы :) Код тот последний раз работал на таких больших датасетах лет 8 назад. С тем же числом ядер, но в другой нума-топологии. То есть может баг был всегда. А может разница в процессорах вызвала к жизни рейс. А может это повреждение памяти в фиксированном месте которое потом приводит к крешу в рандомном месте. А может это 10-тка срёт. Неизвестно.

Код собирается в 2015 студии то ли 2008 то ли 2010 компилятором (лень запускать сборочную машину чтобы проверить). Пропатченный буст и не-исключено-что-пропатченные pcre, и mpich2.
Всё каких-то дремучих версий. Тьфу!

Теперь надо пересобрать в 2019-й и портировать патчи на новый буст. В надежде что это поможет. А не поможет так хоть вспомню, чем как и что собирать.

Это на фоне того, что обнаружилось, что код переподключения в перловой библиотеке на винде работает, только если на сервере стоит родной редхетовский фаерволл. А если пустые iptables - то вешается в странных местах в которых вешаться не должон. Какое-то хитрое взаимодействие таймаутов неактивности в nat в роутере и state ESTABLISHED в фаерволле (на другом хосте).

Тьфу!
Tags: programming, все пидарасы а я
Subscribe

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 19 comments