Додай хештег в Instagram — потренуй штучний інтелект

Неймовірно, але факт: хештеги у звичній нам сьогодні формі індексування різних груп повідомлень у соціальних мережах почали використовуватися у 2007 році. Тоді Кріс Мессіна (Chris Messina) у Twitter запитав, як громадськість ставиться до того, щоб використовувати символ «#» для позначення різних груп. В Америці хештеги стали популярними у 2007 році під час лісових пожеж у Сан-Дієго, коли Нейт Ріттер (Nate Ritter) використовував хештег «#sandiegofire», щоб бути у курсі всіх оновлень, пов’язаних з катастрофою. На міжнародному рівні хештег став практикою запису для повідомлень Twitter у 2009-2010 роках під час іранських виборів. У 2014 році Оксфордський словник зареєстрував слово «хештег», а сьогодні виявляється, що у цього типу маркування з’явилася ще одна – навчальна – функція. Деталі – в адаптованому перекладі матеріалу з видання Popular Science.

Хештег – підручник для візуальних комп’ютерних систем

Розгляньмо хештеги Instagram. Коли людина завантажує фотографію на платформу, що належить компанії Facebook, вона може додати хештег. Приміром, #любов, #мода або #фотодня (це приклади найпопулярніших хештегів минулого року). Ці мітки ілюструють абстрактні поняття, утім, існує безліч більш конкретних описів, як от #бурийведмідь, які, як не дивно, супроводжують саме фото ведмедиків.

І хоча хештеги – прекрасний інструмент сортування, що допомагає людям побачити мільйони фотографій #подорож в одному місці, розробники Facebook використали фотографії з ярликами для іншого – тренування ПЗ із розпізнавання зображень, що є одним з різновидів штучного інтелекту під назвою «комп’ютерний зір», за допомогою якого комп’ютер навчають розпізнавати те, що знаходиться на зображенні. Компанія використала близько 3,5 млрд фотографій з Instagram (з відкритих облікових записів) та 17 тис. хештегів для підготовки системи комп’ютерного зору, яка, на їх думку, нині є найкращою зі створених ними. Директор з питань технологій Facebook Майк Шропфер (Mike Schroepfer) назвав результати «останнім словом техніки».

Слабкий контроль

Щоб зрозуміти, чому цей підхід – цікавий, варто з’ясувати різницю між «повністю контрольованим» та «дещо контрольованим» навчанням AI-технологій. Системи комп’ютерного зору необхідно навчати розпізнавати об’єкти. Покажіть цим системам, наприклад, зображення з позначкою «ведмідь», і вони можуть навчитися виявляти зображення, на яких є ведмеді. Коли дослідники використовують позначені людьми фотографії для навчання систем штучного інтелекту – маємо справу з «повністю контрольованим» навчанням. Зображення чітко позначені, і ПЗ може вчитися на них.

«– Це прекрасний, зарекомендований спосіб, – говорить Манохар Палурі (Manohar Paluri), керівник групи комп’ютерного зору відділу прикладного машинного навчання Facebook, який проводив дослідження разом з іншим підрозділом соціальної мережі, що проводить дослідження штучного інтелекту. Єдина проблема з цим підходом полягає у тому, що зображення вже повинні бути марковані, і це – робота людини. – Позначення мільярдів зображень стає нездійсненним завданням».

У світі штучного інтелекту чим більше даних, на яких може вчитися система, тим краще. Важливим аспектом є і їх розмаїття. Якщо ви прагнете навчити систему штучного інтелекту розпізнавати, як виглядає весілля, їй варто показувати не лише фотографії весіль однієї країни, а натомість – весіль з усього світу.

При «дещо контрольованому» навчанні використовуються дані, що не були навмисно промарковані людиною з метою навчання штучного інтелекту. Саме у цьому випадку були використані всі ці мільярди фотографій з Instagram. Хештеги стали способом виконання колективної роботи з маркування зображень. Наприклад, мітка #бурийведмідь у поєднанні з аналогічним тегом #ursusarctos (латинська назва бурого ведмедя) стає міткою для зображень ведмедів.

Шум соцмереж

Користувачі Instagram, самі того не відаючи, перетворилися на маркувальників. Проте, такі дані – невідсортовані та недосконалі. Вони створюють так званий «шум». Наприклад, Палурі зазначає, що людина, яка фотографується біля Ейфелевої вежі, може поставити цей тег в Instagram, хоча самої вежі не видно. Такий ярлик має сенс у людському контексті, але не допомагає комп’ютеру. За іншим сценарієм фотографія з дня народження, на якій зображено торт, може не містити позначку #торт, що також не є корисним, якщо ви намагаєтеся навчити комп’ютер, як виглядає такий десерт.

Однак, кінцевий результат полягає в тому, що попри «шум» у вихідних даних такий тип навчання, за словами Палурі, теж виявився вдалим. За однією зі шкал оцінювання, система, навчена на основі мільярда фотографій з Instagram, демонструє точність у 85%. Палурі говорить, що наразі це – найпотужніша система комп’ютерного зору від Facebook. Якщо ви користуєтеся Facebook, ви знаєте, що соціальна мережа може розпізнавати обличчя на завантажених фотографіях і пропонує відмітити на них людину з кола ваших друзів. Це – приклад комп’ютерного зору, у цьому випадку – розпізнавання обличчя. Видима користувачам сторона медалі, хоча є й інша – невидима. Facebook використовує комп’ютерний зір для виявлення не лише облич, а й іншого візуального контенту, наприклад, порнографії, яка не дозволена на онлайн-платформі.

Раніше система розпізнавала, що на цьому фото зображено дерево, тепер – що це верба

Палурі говорить, що нова, натренована на основі Instagram, технологія вже використовується з метою сортування та виявлення у фотографіях контенту, який не повинен бути на сайті. Коли йдеться про розпізнавання «небажаного контенту», платформа досягла «значного покращення точності».

БІЛЬШЕ ЦІКАВОГО ПРО AI:

Джерело: Popular Science, переклад підготувала Ірина Гоял, спеціально для «Блог Imena.UA»