Программисты из Университета им. Бен-Гуриона, Израиль, разработали спам-фильтр, который способен, в прямом смысле, понимать, о чём идёт речь в очередном электронном письме.
Инженеры под руководством профессора Марка Ласта (Mark Last) создали программу, которая разбивает всю текстовую часть сообщений на блоки, и подвергает их глубокому анализу. Из каждого блока выделяются ключевые слова для тезисного представления письма.
Таким способом длинные письма “сжимаются” максимум до пары сотен слов, благодаря чему с их содержанием можно ознакомиться, даже не открывая само “тело” послания.
Марк Ласт и его команда создали алгоритм, который осуществляет статистический и семантический анализ содержимого, выстраивая “характеристические модели” материалов по результатам их сканирования.
Проще говоря, новый спам-фильтр будет практически безошибочно отделять очередную рекламу – пусть даже замаскированную под личное письмо – от, собственно, нужной корреспонденции.
Программа пока что ориентирована на работу с англоязычными текстами. Со временем Ласт и его команда адаптируют свои алгоритмы и для других языков.
Отметим, что скорость реакции Интернет-мошенников на мировые события стремительно растёт. В среднем у сетевых преступников уходит всего 22 часа на то, чтобы подготовить новую преступную спам-схему, связанную с громким событием в мире.