Як штучний інтелект допомагає у вивчені історії?

Останні декілька років у історичній царині спостерігається новий тренд — спроба об’єднати її з аналізом даних та інформатикою. Історики шукають нові способи добування інформації зі старих джерел за допомогою штучного інтелекту.

Завернутий у конверт та підкріплений червоним воском заповіт Катаручіа Савонаріо (Catharuçia Savonario) пролежав у Державному архіві у Венеції понад 650 років. Документ, що написаний в 1351 році, досі не був розпечатаний. Але для фізика Фауції Альбертин (Fauzia Albertin) він виявився відмінним об’єктом для експерименту.

Альбертин, який працює зараз в Дослідницькому центрі Енріко Фермі в Італії, захотів прочитати той самий заповіт, не відкриваючи його. Як? Звичайно за допомогою рентгену. Він направив рентген на документ для того, аби сфотографувати текст зсередини. Але як прочитати текст, якій був написаний на декількох сторінках? Альбертин, використовуючи алгоритми, розділив шість сторінок у цифровому вигляді, аби розбірливо скопіювати рукописні слова в конверті.

Команда Альбертина поки що не знає до кінця, про що саме йдеться у заповіті. Савонаріо використав стару форму італійської мови, що, у свою чергу, дещо ускладнило процес перекладу. Але ця техніка має допомогти історикам вивчити тексти, не пошкоджуючи фізичні об’єкти.

Альбертин бере участь в розробці великого проекту під назвою «Машина часу», ціль якого – створити пошукову систему типу Google, яка охоплювала б 2000 років європейської історії. Для цього дослідники планують оцифровувати та організувати архіви європейських міст в одну єдину базу даних, пояснює Фредерік Каплан, керівник проектом. Історики зможуть сканувати бібліотеки закритих томів за допомогою рентгенівських технік Альбертина, надсилати скани алгоритму розпізнавання тексту, який розробляє команда, а він буде автоматично заносити текст до бази даних.

Каплан також сподівається на те, що Машина часу буде пропонувати функцію зображення карт, де ви можете переглянути, наприклад, паризькі вулиці XIX століття. У них є якісні фото з повітря над Парижем цієї епохи. Аби зобразити місто у різні часи, дослідники зможуть використовувати штучний інтелект, навчений на історичних даних про міське планування.

Велика база даних дозволить історикам вивчити суспільні моделі протягом довготривалого періоду часу та при великих географічних масштабах. Цей проект являється частиною нового тренду, коли дедалі більше істориків намагаються використовувати інформатику та аналіз даних для здобуття нової інформації зі старих текстів. Коли історики пропонують проекти на грантове фінансування, «це майже завжди вимагає створити базу даних та зробити якийсь мережевий аналіз», — стверджує історик Йоханнес Прайзер-Капеллар (Johannes Preiser-Kapeller).

Наприклад, історик Хільде де Вердт (Hilde De Weerdt) та її команда створили інструмент, який автоматично помічає імена, місця та час у цифрових китайських та корейських текстах. Вони розробили базу даних, аби вона могла під’єднуватися до програмного забезпечення для налаштування карт, так їм було легше візуалізувати, як люди та ідеї переміщуються у просторі та часі.

Аналіз даних здатен захищати від суб’єктивності – коли вчені виділяють лише ті випадки, які підтримують їх погляди.

«Коли ви системно збираєте докази та вводите їх у базу даних, ви автоматично відмежовуєтесь від суб’єктивності», — говорить Прайзер-Капеллер.

Навіть відносно прості проекти, засновані на даних, можуть дати нам нове розуміння історії. Історик Майрин МакКерон (MacCarron) внесла 600 персонажів з тексту VIII століття «Церковна історія англів» у величезну таблицю Excel. Разом із командою вона також записала кожну взаємодію між персонажами.

«У нас навіть існує категорія для посмертних взаємодій. Оскільки це старі релігійні тексти, святі повертаються до живих та творять чудеса», — пояснює вона.

Історика МакКерон цікавить взаємодія жінок у тексті. У історії жінки завжди виступали «посередниками миру» — вони завжди запобігали конфліктам, виходячи заміж за керівників сусідньої держави. Але мережевий аналіз відкриває їх складніші ролі. МакКерон виявила, що троє з дванадцяти найбільш соціально пов’язаних персонажів в тексті були саме жінками.

Але не всі історики впевнені в перевагах такого підходу.

«Коли я вирішила використати цю систему, я думала, що вона буде потужнішою, ніж це було насправді» — стверджує історик Міхаль Біран (Michal Biran), яка створила базу даних та зобразила у ній соціальну взаємодію у часи Монгольської імперії в XIII-XIV століть.

Проблеми, за словами Біран можуть бути викликані складністю її матеріалу. Оскільки монгольська писемність практично не дійшла до наших часів, історик в основному вивчає документи, написані на мовах монгольських підданих – японська, перська та російська. У різних мовах у персонажів різні імена; навіть в одній мові ім’я одного і того ж персонажу може відрізнятися. Аби правильно розібрати імена, потрібно детально вивчати тексти; всю цю інформацію потім складно відсортувати у красиві цифрові коробки, пояснює Біран.

Проте, згідно Де Вердт, навіть якщо текст оригіналу легко переводиться у цифровий вигляд, все ще не можна повністю покладатися на аналіз даних. В кінцевому вигляді, історія засновується на текстах, та «чим більше ви запроваджуєте математичних процесів, тим далі ви відходите від заданого тексту», — говорить вона. Аби дійсно зрозуміти деталі первинних документів, потрібно мати спеціалізовані історичні знання.

«В історії рідко можна бути у чомусь впевненим. Все суб’єктивно. Кожне джерело якоюсь мірою розкриває суб’єктивність автора», — стверджує МакКерон.

Однак, об’єднавши історичні джерела та проаналізувавши їх паралельно, ймовірно, ви зможете відсіяти декотрі упередження та наблизитись до істини.

БІЛЬШЕ ЦІКАВОГО:

Джерело: Wired

Як штучний інтелект допомагає у вивчені історії?

Читайте также: