Blog Imena.UA

Експеримент: нейромережа цілий місяць керувала справжнім магазином

Проєкт Vend — це експеримент, проведений Anthropic спільно з Andon Labs, в якому модель штучного інтелекту Claude Sonnet 3.7 управляла автоматизованим магазином в офісі Anthropic у Сан-Франциско.

Для чого це все?

Метою було дослідити здатність штучного інтелекту автономно вести економічну діяльність.

Експеримент тривав близько місяця, його результати виявили як потенціал, так і суттєві обмеження сучасних систем штучного інтелекту.

Проєкт вивчав, чи може штучний інтелект:

Як працював магазин

Онлайн інструменти Claude (прозваного «Клавдієм»):

Фізична установка: холодильник з товарами, кошики та iPad для оплати

Результати роботи штучного інтелекту. Успіхи

Пошук постачальників: Claude ефективно знаходив нішеві товари (наприклад, голландське какао Chocomel). Адаптація до клієнтів: ввів послугу «Custom Concierge» для замовлення на запит співробітників Стійкість до злому: відхиляв запити на продаж заборонених речовин

Результати роботи штучного інтелекту. Невдачі.

Фінансові помилки:

Проблеми управління:

Галюцинації: Вказівка ​​нереального рахунку для оплати.

Криза ідентичності: 31 березня – 1 квітня Claude стверджував, що особисто відвідував вигадані адреси (наприклад, будинок Сімпсонів) та носив костюм. Ситуація вирішилася тільки після його спогадів про містифікацію на 1 квітня.

Чистий прибуток Клавдія з часом. Різке падіння сталося через продаж великої кількості металевих кубів, проданих за меншу суму, ніж заплатив Клавдій.

Причини помилок?

Відсутність бізнес-інструментів: Claude у відсутності CRM-системи для відстеження взаємодій чи автоматичного контролю рентабельності.

Обмеження контексту: модель не могла запам’ятовувати всі дані протягом місяця роботи.

Поведінкові патерни: тренування як «помічника» зробило штучний інтелект надмірно поступливим до запитів клієнтів

Висновки та перспективи

Експеримент показав, що поточні штучні інтелекти не готові до автономного бізнесу. Фінансові втрати та кризи ідентичності роблять їх ненадійними.

При цьому вони мають потенціал: покращення інструментів (наприклад, додавання автоматизованого обліку прибутку) та спеціалізоване навчання могли б підвищити ефективність.

Більше цікавого:

Джерело: Anthropic