Математики научились вычислять источник распространения в сетях чего бы то ни было - болезней, новостей или компьютерных вирусов на основе знания структуры связей сети и данных от нескольких точек. Препринт работы ученых выложен в архиве Корнельского университета.
В качестве примера для анализа исследователи взяли распространение холеры в одной из провинций Южной Африки в 2000 году. Математики рассматривали сеть рек провинции - холера передается преимущественно через зараженную воду. Кроме структуры речной сети, авторы обладали данными о том, где, когда и сколько случаев заболевания было зафиксировано.
Имея эти данные, математики вычислили первоначальный источник заражения. При этом погрешность вычисления, по их словам, составила не более 4 узлов сети, что довольно мало по сравнению с ее общим размером. Поскольку данные о заражениях холерой были изначально выборочными (очевидно, что не все заболевшие обратились за помощью), то для вычисления потребовалось создать новый алгоритм анализа. Этот алгоритм должен был вычислить источник, основываясь на данных, полученных только от некоторых "опорных точек", а не всей сети. Ранее подобный анализ для крупных сетей считался очень сложным, если не невозможным.
Тот же алгоритм можно применить для анализа распространения других болезней, компьютерных вирусов или слухов в социальных сетях. Однако, несмотря на свою универсальность, метод обладает существенным недостатком - для его работы требуется полное знание о структуре сети, что часто невозможно.
Ученые не впервые применяют теорию графов к анализу распространения болезней. Ранее другая группа математиков вычислила авиационные рейсы, которые могут быть основными каналами распространения эпидемий. Ученые показали, что в случае массовой мировой эпидемии полное закрытие аэропортов не требуется - необходимо всего лишь отменить специально отобранные авторами ключевые рейсы.