Учёные научились находить источник слухов в соцсетях

В социальных сетях информация распространяется очень быстро. И найти первоисточник в большинстве случаев не так то просто, особенно если пользователь, запустивший информационную волну, уже успел “замести следы”. Однако учёные нашли способ определить источник любого информационного сигнала в массиве «зашумленных» сетевых данных.

Исследовательская группа при Федеральной политехнической школе Лозанны, работающая под руководством профессора Педро Пинту (Pedro Pinto), разработала математический алгоритм, позволяющий точно определять источник слухов в социальной сети. При его использовании, становится возможным отыскать источник любого информационного сигнала в массиве сильно «зашумленных» данных в сети, используя в качестве отправной точки всего 15–20 членов этой сети. Анализ происходит с учётом временного фактора и некоторых других доступных параметров сообщения, которые учёные не разглашают. И в итоге моделируется траектория распространения информации и находится её источник.

Для примера: Поиск источника холеры в Южной Африке.
Оценка источника на произвольном графе G.

(красной точкой отмечен источник информации, зелёными –- наблюдатели)

В некоторое время t* источник s* начинает распространять информацию. Синии линии показывают тех, кто передал её дальше. На этом примере показаны три наблюдателя, которые анализируют от каких соседей и в какое время они получили информацию. Основная цель -– выяснить какой узел является источником вброса информации.

Интересно, что область применения алгоритма не ограничивается только социальными сетями. Его также можно применять в реальной жизни, когда требуется, например, локализовать и обезвредить источник эпидемии.

“Мы протестировали алгоритм на эпидемических данных, полученных в ЮАР. Построив модель местного водоснабжения, включающую речную сеть, очистные сооружения, водопроводы, естественные водоемы, цистерны-отстойники и прочие промежуточные элементы, эксперты смогли посредством вышеупомянутого алгоритма локализовать инфекционные очаги холеры, опираясь на мониторинг очень небольшой группы деревень. Примечательно, что эти очаги совпали с теми, которые ранее были определены эпидемиологами, использовавшими более сложные, медленные и затратные технологии,- рассказал Профессор Пинту.

(зелёными точками показаны наблюдатели, красными — инфицированные узлы после 9 месяцев (Май 2011))

Слева изображена Гидрографическая карта провинции Квазулу-Натал. Красные точки соответствуют местонахождению первых выявленных случаев заболевания холерой. Справо – Графическая модель бассейна реки Тукела. Узлами обозначены небольшие сообщества людей и расположенные возле них резервуары воды, которые могут быть заражены холерным вибрионом. Линии отображают движение инфекции между соседними сообществами, вызванные гидрологическими потоками и перемещением людей. Чтобы локализовать источник эпидемии, ученые проанализировали 20% случайно выбранных сообществ (отмечены зеленым цветом).

Среднее расстояние между контрольными источниками и первым инфицированным сообществом, в сравнении с плотностью наблюдателей: K/N. Взяв за основу 20% наблюдателей, учёные достигли средней ошибки менее чем 4 отрезка. Стоит заметить, что первая инфицированная группа людей не обязательно является источником холеры, по причине значительного промежутка времени между первоначальным инфицированием и реальным проявлением болезни.

Вывод: если правильно разместить сенсорные точки в сети, то можно научиться быстро реагировать на любые вызовы – будь то эпидемия, теракт или же «слив» информации.

Ученые полагают, что методика способна облегчить работу не только криминалистам, но и социологам, маркетологам, медикам и даже обычным пользователям сетевых сервисов.