Онлайн-энциклопедия, которая пишет себя сама

Этот сайт выглядит подобно страницам Википедии. Но на самом деле все статьи, содержащие краткую информацию о  людях и организациях и дополненные списком ассоциированных компаний, людей и событий, написаны компьютером. Некоторое время назад Пентагон инициировал проект создания «умной» машины, которая способна следить за глобальными новостями и обеспечивать разведчиков краткими информационными выжимками о различных событиях в режиме, близком к реальному времени.

(сайт онлайн-энциклопедии, генерируемый компьютером, предоставляет довольно точную информацию, но не всегда точную)

Прототип системы является частью закрытого сайта, построенного для разведывательного управления исследовательской лабораторией Raytheon BBN в Кембридже, Массачусетс. Система собирает информацию с 40 новостных веб-сайтов на английском, китайском и арабском языках, но постепенно будет охватывать сотни новых ресурсов, публикуемых на всех основных языках мира. В конечном счёте система будет интегрирована с существующей мониторинговой сетью ТВ-вещания — BBN Broadcast Monitoring System. которая создаёт непрерывный архив международных телевизионных передач. Она автоматически расшифровывает аудиопоток и переводит текст на английский язык.  Обеспечивается возможность поиска как по транскрипции, так и по переводу. По планам она будет запущена в рабочую эксплуатацию уже в этом году.

(система BBN Broadcast Monitoring)

Например, на запрос о нигерийском движении джихад Boko Haram, можно получить следующий, сгенерированный компьютером ответ: «Основанное Мохаммедом Юсуфом в в 2002 году движение Boko Haram возглавляет Ибрагим Абубакар Шекау. (Среди прежних лидеров был Мохаммед Юсуф). Штаб-квартира движения расположена в Майдугори. Организацию характеризуют как ‘новая радикальная фундаменталисткая секта’, ‘основная причина беспорядков в государстве’, ‘секта без четкой структуры’, и ‘заблуждающаяся экстремистская секта’».

Без сомнения, статья в Википедии даёт более четкую и внятную характеристику Boko Haram. С другой стороны, система BBN оперативно «захватывает» всё, что публикуется на новостных сайтах, и постоянно пополняет информацию, которая содержится в её базе.

Технология разработана так, что система начинает собирать информацию с «сущности»: имени человека или организации, причём с учётом различного произношения. Затем она идентифицирует другие данные (события или людей), которые имеют к ней отношение. Систему можно обучать, предоставляя ей примеры того, какое отношение друг к другу имеют различные объекты.

Проект BBN является продуктом Управления перспективного планирования оборонных научно-исследовательских работ, его сотрудники разработали машину, которая мыслит как человек. Сама задача известна уже давно, однако в последнее время её решением занялись более активно. В рамках исследовательской программы DARPA прототипы системы построили компании SRI International, IBM, а также Raytheon BBN.

Автоматическое резюмирование текста общепризнанно является сложной задачей, поскольку система должна уметь определять юмор, сарказм, выявлять некорректную информации, идиомы, различное написание и синтаксис. Нельзя не упомянуть и  проблему интерпретации и перевода информации с других языков.

По этой причине, многие из итоговых статей системы выглядят довольно таки смешно или неверно. Например, Барак Обама корректно идентифицирован как президент США, однако далее статья содержит такие строки: «Обаму представили как лауреата нобелевской премии мира», «единственного благоразумного парня в этой комнате», «активиста движения против апартеида» и т. д.

Системе не хватает реальных знаний, которые помогают людям анализировать какую-либо информацию как ложь, юмор или просто неуместную. Более того, некоторые продукты системы могут быть просто комичными. Например, информация про Авраама Линкольна содержит много точных данных. Однако цитата, которую машина составила из наиболее известных высказываний американского президента, говорит о том, что не все еще отлажено в системе: «Авраам Линкольн сказал, что точка меда ловит мух больше, чем бочка рыбы из горькой пилюли, то же самое касается и людей».

Иными словами, подобный машинный интеллект вряд ли заменит людей в ближайшем будущем.