Чи може штучний інтелект вийти за межі екрана й перетворитися на річ, до якої ми тягнемося рукою? У Массачусетському технологічному інституті на це відповіли проєктом, що поєднав фізичний інтерфейс і можливості великих мовних моделей. Так народився Kitchen Cosmo – пристрій, який сканує продукти й одразу видає рецепт на папері.
Від ідеї LLOs до навчальної студії MIT
Раніше на курсі 4.043/4.044 Interaction Intelligence в MIT поставили завдання навчитися «вбудовувати» ШІ в реальні об’єкти. Так з’явилася концепція великих мовних об’єктів (LLOs) – фізичних інтерфейсів, що розширюють можливості мовних моделей у реальний світ. Їхня поведінка створюється під конкретну людину чи сценарій, а взаємодії поступово ускладнюються – від базових підказок до експертних режимів. Викладачі наголошують: мовним моделям бракує контексту живого середовища, тож LLOs покликані закрити цей розрив і сформувати фізично вбудований штучний інтелект як нову дисципліну дизайну.
Ключова подія: народження Kitchen Cosmo
Завданням було створити пристрій, який справді знадобиться в побуті. Студенти Джейкоб Пейн та Ая Махмуд обрали кухню – і згадали про історичний прецедент: Honeywell Kitchen Computer (1969), який Neiman Marcus пропонував за $10,000, але, за наявними даними, жодного екземпляра так і не придбали. Їхній рецептурний генератор Kitchen Cosmo виріс із цієї ідеї, та пішов далі завдяки LLOs.
Пристрій має корпус заввишки приблизно 18 дюймів, «ретро»-оболонку, надруковану на 3D-принтері, і червоне забарвлення на знак поваги до історичного прототипу. Верхня вебкамера зі скануванням інгредієнтів відкидається на шарнірі – користувач викладає продукти на стільницю, а система розпізнає складники та пропонує страву з урахуванням базових спецій і соусів, які зазвичай є в домі. Рецепт виводиться на вбудований термопринтер, а роздруківки зберігаються у спеціальному контейнері в основі.
«Це була амбітна, але непрактична рання спроба домашнього кухонного комп’ютера – і водночас влучне історичне посилання для нашого проєкту», – пояснює Джейкоб Пейн, коментуючи роль Honeywell Kitchen Computer.
Як відреагували: що сказали в аудиторії й поза нею
Перші демонстрації викликали жвавий інтерес на курсі, а згодом про прототип коротко написали профільні дизайн-видання. Однокурсники запропонували розширити можливості – від спільного готування з розподілом ролей до навчального режиму для кухонних інструментів. У дискусії викладачі акцентували, що LLOs дають моделі не лише голос, а й тіло та контекст, завдяки чому взаємодія стає осмисленішою.
«Потужні, але нові форми інтелекту здебільшого не розуміють світ поза мовою. LLOs, натомість, фізично присутні та взаємодіють із середовищем у реальному часі», – зазначає викладач курсу Марсело Коельйо.
Що змінилося: налаштування, тести й фізичне керування
Після перших ітерацій команда збалансувала роботу моделі під реальні кухонні параметри – нагрів, час, температуру – і навчила її краще враховувати смакові профілі та спеції різних регіонів. В інтерфейсі з’явилися селектори для типу прийому їжі, рівня навичок, доступного часу, кількості порцій і навіть бажаного настрою. Тактильні перемикачі дисциплінують діалог із ШІ та роблять його «партнером», а не невидимою підказкою.
- Додано підтримку культурно точних смакових профілів – модель краще співвідносить інгредієнти зі спеціями регіональних кухонь.
- Упроваджено фільтри для сценаріїв готування: від сніданку до вечері, з урахуванням навичок користувача і часу приготування.
- Розширено фізичний контроль – «повзунок настрою» і тактильні регулятори дозволяють керувати стилем рецепта без екрана.
Що чекає попереду: від підказок у реальному часі до навчального режиму
Далі команда планує під’єднати більше даних кухонного середовища – щоб ШІ підказував кроки приготування в реальному часі та допомагав коригувати страву «на льоту». Серед ідей – багатокористувацькі сценарії з розподілом задач і «режим навчання», у якому пристрій пояснює техніку роботи з інструментами. Ая Махмуд також вивчає історію та науку про їжу, аби глибше «навчити» модель смакам і текстурам. Ці кроки мають перетворити Kitchen Cosmo на більш зрілий приклад того, як MIT розвиває LLOs від академічного прототипу до корисного помічника на кухні.
Serg Kulyk is the most experienced member of our team and a graduate of the Kyiv University of Culture. As a private journalist, he has worked with many media outlets, developing his skills as an OSINT researcher. Using the latest technologies, Sergcreates deeply analytical materials, always relying on verified facts and truthful information.
uk
