Додай хештег в Instagram — потренуй штучний інтелект

Неймовірно, але факт: хештеги у звичній нам сьогодні формі індексування різних груп повідомлень у соціальних мережах почали використовуватися у 2007 році. Тоді Кріс Мессіна (Chris Messina) у Twitter запитав, як громадськість ставиться до того, щоб використовувати символ «#» для позначення різних груп. В Америці хештеги стали популярними у 2007 році під час лісових пожеж у Сан-Дієго, коли Нейт Ріттер (Nate Ritter) використовував хештег «#sandiegofire», щоб бути у курсі всіх оновлень, пов’язаних з катастрофою. На міжнародному рівні хештег став практикою запису для повідомлень Twitter у 2009-2010 роках під час іранських виборів. У 2014 році Оксфордський словник зареєстрував слово «хештег», а сьогодні виявляється, що у цього типу маркування з’явилася ще одна – навчальна – функція. Деталі – в адаптованому перекладі матеріалу з видання Popular Science.

Хештег – підручник для візуальних комп’ютерних систем

Розгляньмо хештеги Instagram. Коли людина завантажує фотографію на платформу, що належить компанії Facebook, вона може додати хештег. Приміром, #любов, #мода або #фотодня (це приклади найпопулярніших хештегів минулого року). Ці мітки ілюструють абстрактні поняття, утім, існує безліч більш конкретних описів, як от #бурийведмідь, які, як не дивно, супроводжують саме фото ведмедиків.

І хоча хештеги – прекрасний інструмент сортування, що допомагає людям побачити мільйони фотографій #подорож в одному місці, розробники Facebook використали фотографії з ярликами для іншого – тренування ПЗ із розпізнавання зображень, що є одним з різновидів штучного інтелекту під назвою «комп’ютерний зір», за допомогою якого комп’ютер навчають розпізнавати те, що знаходиться на зображенні. Компанія використала близько 3,5 млрд фотографій з Instagram (з відкритих облікових записів) та 17 тис. хештегів для підготовки системи комп’ютерного зору, яка, на їх думку, нині є найкращою зі створених ними. Директор з питань технологій Facebook Майк Шропфер (Mike Schroepfer) назвав результати «останнім словом техніки».

Слабкий контроль

Щоб зрозуміти, чому цей підхід – цікавий, варто з’ясувати різницю між «повністю контрольованим» та «дещо контрольованим» навчанням AI-технологій. Системи комп’ютерного зору необхідно навчати розпізнавати об’єкти. Покажіть цим системам, наприклад, зображення з позначкою «ведмідь», і вони можуть навчитися виявляти зображення, на яких є ведмеді. Коли дослідники використовують позначені людьми фотографії для навчання систем штучного інтелекту – маємо справу з «повністю контрольованим» навчанням. Зображення чітко позначені, і ПЗ може вчитися на них.

«– Це прекрасний, зарекомендований спосіб, – говорить Манохар Палурі (Manohar Paluri), керівник групи комп’ютерного зору відділу прикладного машинного навчання Facebook, який проводив дослідження разом з іншим підрозділом соціальної мережі, що проводить дослідження штучного інтелекту. Єдина проблема з цим підходом полягає у тому, що зображення вже повинні бути марковані, і це – робота людини. – Позначення мільярдів зображень стає нездійсненним завданням».

У світі штучного інтелекту чим більше даних, на яких може вчитися система, тим краще. Важливим аспектом є і їх розмаїття. Якщо ви прагнете навчити систему штучного інтелекту розпізнавати, як виглядає весілля, їй варто показувати не лише фотографії весіль однієї країни, а натомість – весіль з усього світу.

При «дещо контрольованому» навчанні використовуються дані, що не були навмисно промарковані людиною з метою навчання штучного інтелекту. Саме у цьому випадку були використані всі ці мільярди фотографій з Instagram. Хештеги стали способом виконання колективної роботи з маркування зображень. Наприклад, мітка #бурийведмідь у поєднанні з аналогічним тегом #ursusarctos (латинська назва бурого ведмедя) стає міткою для зображень ведмедів.

Шум соцмереж

Користувачі Instagram, самі того не відаючи, перетворилися на маркувальників. Проте, такі дані – невідсортовані та недосконалі. Вони створюють так званий «шум». Наприклад, Палурі зазначає, що людина, яка фотографується біля Ейфелевої вежі, може поставити цей тег в Instagram, хоча самої вежі не видно. Такий ярлик має сенс у людському контексті, але не допомагає комп’ютеру. За іншим сценарієм фотографія з дня народження, на якій зображено торт, може не містити позначку #торт, що також не є корисним, якщо ви намагаєтеся навчити комп’ютер, як виглядає такий десерт.

Однак, кінцевий результат полягає в тому, що попри «шум» у вихідних даних такий тип навчання, за словами Палурі, теж виявився вдалим. За однією зі шкал оцінювання, система, навчена на основі мільярда фотографій з Instagram, демонструє точність у 85%. Палурі говорить, що наразі це – найпотужніша система комп’ютерного зору від Facebook. Якщо ви користуєтеся Facebook, ви знаєте, що соціальна мережа може розпізнавати обличчя на завантажених фотографіях і пропонує відмітити на них людину з кола ваших друзів. Це – приклад комп’ютерного зору, у цьому випадку – розпізнавання обличчя. Видима користувачам сторона медалі, хоча є й інша – невидима. Facebook використовує комп’ютерний зір для виявлення не лише облич, а й іншого візуального контенту, наприклад, порнографії, яка не дозволена на онлайн-платформі.

Раніше система розпізнавала, що на цьому фото зображено дерево, тепер – що це верба

Палурі говорить, що нова, натренована на основі Instagram, технологія вже використовується з метою сортування та виявлення у фотографіях контенту, який не повинен бути на сайті. Коли йдеться про розпізнавання «небажаного контенту», платформа досягла «значного покращення точності».

БІЛЬШЕ ЦІКАВОГО ПРО AI:

Джерело: Popular Science, переклад підготувала Ірина Гоял, спеціально для «Блог Imena.UA»

Читайте также:

Google DeepMind навчила робота грати в настільний теніс на рівні людини

Інтерв’юер із застосуванням штучного інтелекту вже не новина або як працюють передові HR сервіси по всьому світу

Як плани Google відмовитися від звичного пошуку можуть змінити інтернет

Румунський стартап розробляє розумні окуляри, які допоможуть бачити сліпим