Як голосові помічники програли чат-ботам

Віртуальні помічники мали понад десять років, щоб закріпитися в нашому повсякденному житті. Однак обмеження та незручний дизайн залишили вільну нішу – і зараз її займають чат-боти.

То був дощовий вівторок. У Сан-Франциско керівники Apple піднялися на сцену перед повним залом та представили iPhone 5-го покоління. Телефон виглядав ідентично минулої версії, але мав нову функцію, яку незабаром почав обговорювати весь зал: віртуальний асистент Siri.

Скотт Форстол, тоді голова відділу програмного забезпечення Apple, натиснув кнопку, щоб покликати Siri, і почав засипати її питаннями. На його прохання Siri назвала час у Парижі, дала визначення слова «мітоз» та запропонувала список із 14 ресторанів грецької кухні з високим рейтингом, 5 з яких знаходились у Пало-Альто, Каліфорнія.

«Я довгий час працюю в області штучного ынтелекту, і це все ще вражає мене», – згадує Форстолл.

Це було 12 років тому. З того часу люди вже встигли охолонути до Siri та її конкурентів на базі штучного інтелекту, на кшталт Alexa від Amazon та Google Асистента. Технологія здебільшого залишалася на колишньому рівні, а голосові помічники стали предметом жартів.

Сьогодні в центрі уваги інші віртуальні помічники — чат-боти. ChatGPT, новий ChatGPT Plus та подібні до них можуть швидко давати імпровізовані відповіді на запитання, задані через чат. Люди використовують ChatGPT для складних завдань на кшталт програмування, підготовки бізнес-пропозицій та навіть написання художніх текстів.

ChatGPT застосовує штучний інтелект, щоб зрозуміти, яке слово буде наступним, та швидко вдосконалюється. Кілька місяців тому він не міг написати хоку, а тепер робить це граючи. 16 березня OpenAI представила GPT-4, двигун нового покоління, на якому працює ChatGPT.

Ажіотаж навколо чат-ботів демонструє, як голосові помічники, які колись викликали подібний ентузіазм, втратили лідерство в перегонах штучного інтелекту.

За останні десятиліття програмні продукти стикалися з проблемами. Джон Беркі, раніше інженер Apple, який працював над Siri, розповідає, що у голосового помічника було чимало технологічних перешкод, наприклад, громіздкий код, через що базові функції могли оновлюватися тижнями.

Колишні співробітники розповідають, що Amazon і Google неправильно оцінили, як використовуватимуться голосові помічники, та інвестували в області, які рідко окупалися. За їхніми словами, коли ці експерименти провалилися, ентузіазм компаній згас.

Цього місяця глава Microsoft Сатья Наделла заявив, що голосові помічники «тупі як пробка», а лідерство за новим штучним інтелектом. Microsoft тісно співпрацює з OpenAI, інвестувала $13 млрд у стартап та впровадила його технологію у пошукову систему Bing та інші продукти.

Apple відмовилася дати коментар Siri. У Google повідомили, що прагнуть надати хорошого віртуального асистента, який зможе надати допомогу через телефон, а також усередині будинків та автомобілів. Компанія також тестує чат-бот Bard. Amazon заявила, що за останній рік взаємодія з Alexa зросла на 30% у всьому світі та що вона з оптимізмом дивиться на свою місію зі створення штучного інтелекту світового класу.

У основі різноманітних чат-ботів лежать так звані великі мовні моделі — системи, навчені розпізнавати та генерувати текст, використовуючи величезні набори даних, зібраних з Інтернету. Вони можуть пропонувати слова, щоб завершити речення.

На відміну від них, Siri, Alexa та Google Асистент являють собою системи управління та контролю. Вони можуть розуміти обмежений список питань та завдань на кшталт «Яка погода в Нью-Йорку?» або «Вимкни світло в спальні». Якщо користувач попросить щось, чого немає в коді, бот просто скаже, що не може допомогти.

Siri також відрізняється складним дизайном, через додавання нових функцій займає багато часу, зазначає Беркі, який працював над покращенням асистента у 2014 році. База даних Siri містить величезну кількість слів, у тому числі імен музикантів і назв таких локацій, як ресторани, майже на двох десятках мов.

Це перетворило її на «велику снігову кулю».

Такі прості на вигляд оновлення, як додавання кілька нових фраз в датасет, потребувало перебудови всієї бази даних, що могло зайняти до 6 тижнів. На впровадження складніших функцій, наприклад, нових інструментів пошуку, пішов би майже рік. Як пояснює Беркі, це означало, що Siri не має можливості стати креативним помічником, подібним до ChatGPT.

За словами колишніх менеджерів Amazon і Google, Alexa та Google Асистент використовували подібний підхід, але компанії припускали, що зароблятимуть на голосових помічниках. Водночас Apple використовувала Siri, щоб залучити покупців до iPhone.

Після того, як у 2014 році Amazon випустила розумну колонку Echo із вбудованою Alexa, вона передбачала, що продукт допоможе збільшити продаж в інтернет-магазині, дозволивши співробітникам робити замовлення через Alexa. Однак, як розповідає екскерівник Amazon, який брав участь у проєкті, людям подобалося запитувати прогноз погоди та встановлювати будильник через помічника, та лише деякі просили його щось замовити.

Можливо, Amazon занадто багато вклала у створення нового обладнання, на зразок будильників та мікрохвильових печей, що працюють з Alexa, які продавалися за заниженими цінами. Деякі з них вже не виробляються.

Компанія також недостатньо інвестувала у створення екосистеми. Коли Amazon запустила магазин «навичок», що дозволяють помічникові керувати сторонніми аксесуарами на кшталт вимикачів, користувачам було важко знайти та налаштувати навички для динаміків. При цьому App Store все завантажувалося безплатно.

Наприкінці минулого року в Amazon було звільнено 18 тисяч людей. Найбільше це торкнулося підрозділу, який працює над Alexa, у тому числі керівників вищої ланки.

Проблеми Amazon з Alexa, можливо, ввели в оману Google.

Інженери Google витратили роки на експерименти з помічником, щоб відтворити те, що може робити Alexa, включаючи розробку інтелектуальних динаміків та екранів планшетів із голосовим керуванням для керування домашніми аксесуарами, такими як термостати та вимикачі світла. Ці товари для дому так і не стали основним джерелом доходу і пізніше в них інтегрували рекламу.

Згодом Google зрозуміла, що більшість людей використовують голосового помічника лише для обмеженої кількості простих завдань, таких як запуск таймерів та відтворення музики. У 2020 році, коли Прабхакар Рагхаван, виконавчий директор Google, очолив роботу над Асистентом Google, команда вирішила переорієнтувати продукт і зробити його значущою функцією смартфонів на Android.

У січні, коли материнська компанія Google звільнила 12 тисяч співробітників, команда, яка працює над операційними системами для домашніх пристроїв, втратила 16% інженерів.

За словами експертів, у майбутньому технології чат-ботів та голосових помічників зближуватимуться. Люди зможуть керувати чат-ботами за допомогою мови, а ті, хто використовує продукти Apple, Amazon і Google, зможуть просити віртуальних помічників допомогти їм не лише з прогнозом, а й з роботою.

«Ці продукти ніколи не працювали в минулому, тому що ми ніколи не мали можливостей для діалогу на людському рівні. Тепер вони з’явилися», — зазначає засновник стартапу Perplexity Аравінд Шрінівас.

Багато великих технологічних компаній зараз поспішають випустити свою відповідь ChatGPT.

БІЛЬШЕ ЦІКАВОГО:

Джерело: TheNewYorkTimes

Читайте также:

Дослідження: люди вже не можуть відрізняти спілкування з людиною та ChatGPT

Перша група одержувачів фінансування від Фонду підтримки Google для стартапів в Україні в 2024 році

Kaggle-змагання з машинного навчання від Google

Все що показала Apple на WWDC 2024