Як працює бібліотека Вікіданих?

Колись ми годинами сиділи в інтернеті, аби знайти потрібну нам інформацію. Сьогодні ми просто звертаємось до віртуального асистента та він робить всю «брудну роботу» за нас. Проблема полягає лише в тому, що комп’ютер не може інтерактивно спілкуватися з користувачем. Видання Wired розповіло про вільну та безкоштовну базу знань Вікіданих завдяки якій це стало можливим. Її може розуміти, використовувати та аналізувати як людина, так і машина.

Наші глибинні, надійні джерела знань зашифровані у старій, незрозумілій для машин технології – прозі. Вона не викликає ніяких складностей, коли ви пишете свій запит у Google. Пошуковим машинам не потрібно читати. Їм потрібно шукати найактуальніші веб-сторінки. Але коли ви запитуєте Google Assistant про те, у який рік народилась та чи інша знаменитість, помічник повинен самостійно та оперативно знайти відповідь на це запитання. Однак, жодна технологія не може просто та швидко окреслити певний зміст серед тисячі речень та абзаців у інтернеті. Для цього машині потрібен певний провідник.

Вікідані (Wikidata) – це близький проект Вікіпедії – ціллю якого є вкінці кінців представить все у Всесвіті в зрозумілій для комп’ютерного розуміння формі. Базу даних підтримує армія волонтерів, і вона стала просто необхідною, коли штучний інтелект та розпізнавання мови стали невіддільною частиною нашого життя.

«Мова засновується на розумінні певного сенсу, до якого у комп’ютера немає доступу» — стверджує Денні Врадевич (Denny Vrandečić), програміст та редактор Вікіпедії, який заснував Вікідані у 2012 році.

Він побачив необхідність в такому місці, де люди та боти могли б ділитися знаннями на рівних умовах для всіх.

Як працює база Вікіданих

Всередині середовища Вікіданих кожна концепція представлена у вигляді цифрового коду. Наприклад, у грудні проект додав у базу шестидесяти мільйонний предмет – білок, який було виявлено у мітохондріях паразиту, що викликає малярію у людини Q133969 (літера Q перед кожним кодом – це своєрідний знак поваги для жінки Врадедича, Камаринсо).

Предмети взаємопов’язані та класифікуються по тегах, аби комп’ютери могли аналізувати відношення між ними. Замість того, аби шукати у Вікіпедії відповідь на питання, чия душа вселилась у Гаррі Поттера (Q3244512), бот може побачити, що тег «душа вселилась» (P4292) вказує на Волан-де-Морта (Q176132). У інших випадках тег, що означає «суперечливість» (P1310) допомагає ботам зрозуміти, що не всі істини признані повсюди. До прикладу, при пошуку відповіді на питання, чи являється Єрусалим столицею Ізраїлю.

Дані можуть додавати в базу як машини, так і люди. Редактори додають нові факти та надають посилання на свої джерела, точно так, як у Вікіпедії. Декотра інформація автоматично з’являється з інших баз даних.

У світі Вікіданих все ж можна знайти місце для креативності. Наприклад, код Q1 розуміє під собою поняття Всесвіту. Письменник Дуглас Адамс (Douglas Noël Adams), записаний як Q42 – це посилання на те, що суперкомп’ютер з його книги «Автостопом по галактиці» назвав «відповіддю на головне питання життя, всесвіту та подібного» число 42. Q1337 – кодова частина для leet.

Для чого потрібна база Вікіданих

Суть цього проекту – не зробити машини схожими з людьми, а допомогти їм в оновленні, шуканні та об’єднанні інформації так, як цього не робили до того. Зв’язки та закономірності у Wikidata дозволяють комп’ютерам відповідати на складні питання менше, ніж за секунду, без необхідності аналізу декількох баз даних. Віртуальні асистенти краще виконують свою роботу завдяки Wikidata.

Той факт, що технології провідних світових компаній покладаються на команду ентузіастів-волонтерів, нагадує нам про те, що штучний інтелект насправді дуже обмежений, ніж може показатися на перший погляд. Wikidata – це неповна база та частіше за все у ній також можна знайти помилки. І все одно технологічні гіганти використовують Wikidata, тому що наші дурні алгоритми так відчайдушно потребують допомоги для розуміння цього світу.

Така залежність насправді грає нам на руку. Знання майбутніх машин можуть бути сформовані кожним із нас, а не тільки докторами наук і великими корпораціями. Вікідані підтримуються німецьким відділенням Фонду Вікімедія – некомерційною організацією, яка підтримує інфраструктуру для роботи цілого ряду багатомовних краудсорсингових вікі-проектів, включаючи Вікіпедію. Після того, як виконавчий директор Вікімедія Кетрін Маєр (Ketrin Maer) запропонувала мегакорпораціям використовувати ці безкоштовні ресурси, не просячи багато навзаєм Amazon та Facebook заплатили їм по мільйону доларів. А Google нещодавно заявила про намір профінансувати організацію на суму $3,1 млн.

Ці кошти допоможуть фонду виправити помилки та зробити спільноти та склади інформації більш представницькими. Маєр вважає, що усі пробіли можна виправити, якщо компанії припинять шукати інформацію лише у Вікіпедії та Вікіданих та почнуть щось робити.

«Це станеться лише тоді, коли до цього досягнення стануть відноситися як до відновлюваного ресурсу, а не тільки як до добувального» — сказала вона.

Якщо ж суспільство прикладе трохи зусиль по створенню інформаційної основи для штучного інтелекту, ми та наші майбутні друзі-боти зможемо досягнути Q238651 – миру на усій планеті Земля.

БІЛЬШЕ ЦІКАВОГО:

Джерело: Wired

Читайте также:

Скрытые затраты автоматического мышления

Як обійти технологію розпізнавання облич? Спроби дослідників

5 простих кроків, щоб зробити штучний інтелект силою добра

5 дуже незвичайних прогнозів від IBM Research