Сегодня 26 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Google создала роботов, которые выполняют сложные голосовые команды — их научили приносить газировку и вытирать лужи

Те, кто использует интеллектуальных голосовых помощников, таких как «Алиса», Siri и т.д., вероятно, заметили, что технология становится умнее с каждым днём. Тем не менее роботов, которые бы выполняли различные команды, озвученные пользователем, пока найти сложно. Роботы-пылесосы не в счёт. Однако Google создала роботов, которые умеют распознавать голосовые команды и правильно их выполнять. Пока что это лишь прототипы, но когда-то они станут полноценным продуктом.

 Источник изображения: Haje Kamps/ TechCrunch

Источник изображения: Haje Kamps/ TechCrunch

Компания Alphabet, в состав которой входит Google, создала новую робототехническую компанию под названием Everyday Robots (англ. — Повседневные роботы). Как следует из названия, целью фирмы является создание роботов, которые учатся самостоятельно и выполняют «повседневные задачи, отнимающие много времени». В сочетании с языковой ИИ-моделью PaLM (Pathways Language Model) робот SayCan от Everyday Robots стал PaLM-SayCan — ботом, способным оценивать свои собственные возможности, окружающую среду и озвученную человеком задачу, а затем разбивать эту задачу на более мелкие подзадачи для достижения желаемой цели.

В то время как большинство роботов тестируются в пределах лаборатории, весь смысл PaLM-SayCan заключается в том, чтобы помочь с разнообразными и часто незапланированными проблемами и задачами. Это вдохновило команды Google и Everyday Robots использовать PaLM-SayCan на офисной кухне. Здесь PaLM-SayCan можно попросить принести пакетик чипсов из ящика стола, выбрать между кока-колой и пепси и даже помочь людям решить проблему пролитого напитка. Казалось бы, это очень простые задачи, но на самом деле нет.

Научить робота выполнять повторяющиеся задачи в контролируемых пространствах без присутствия людей хоть и не самая простая, но вполне решаемая задача. Гораздо сложнее научить робота решать различные задачи на основе голосовых команд в пространствах, где также присутствуют люди. Речь не идёт о таких решениях, как роботы-пылесосы, которые просто запрограммированы на то, чтобы не касаться никаких предметов, кроме пола. С роботами-помощниками всё куда сложнее, ведь он должен правильно понять человека, а также придумать, как выполнить поручение или же сообразить, что сделать этого он не может в принципе.

Google достигла определённого прогресса в задаче понимания роботами естественного языка, который может использовать человек. С помощью своей системы обработки естественного языка Pathways Language Model (PaLM) компания смогла достичь точной обработки фраз и понимания роботом того, что человек на самом деле хочет, а не буквального выполнения сказанного.

Следующая задача — понять, на что на самом деле способен робот. Робот может понять просьбу достать предмет с полки, но проблема в том, что он может не дотянуться до него, так как полка находится слишком высоко. Google называет «возможностями» то, что может делать робот более-менее успешно. Это могут быть простые задачи («продвиньтесь на метр вперёд»), более сложные задачи («найди банку колы на кухне»), а также сложные, многоэтапные действия, требующие от робота понимания собственных способностей и окружающего мира. Например, «Уф, я пролил свою колу на пол. Не могли бы вы вытереть лужу и принести мне новый напиток?». В последнем случае роботу будет необходимо разбить задачу на ряд этапов — определить место, где пролита жидкость, пойти на кухню, найти губку, вернуться назад, собрать воду, опять пойти на кухню, чтобы выжать губку и т.д. Хотя, возможно, ему нужно определиться — может быть лучше сначала принести банку колы, а потом заняться устранением лужи?

Ещё одна проблема, с которой сталкивается робототехника, заключается в том, что языковые модели не привязаны к физическому миру. Например, на запрос «Я пролил свой напиток, вы можете помочь?» языковая модель GPT-3 отвечает: «Вы можете попробовать использовать пылесос». И это имеет смысл для неё, так как языковая модель ассоциирует пылесос с процессом уборки. Хотя пылесос не предназначен для устранения лужи и попытка сделать это может привести к его поломке.

Как утверждают в Google, важно научить роботов определять, что они могут и чего не могут делать, и что имеет смысл делать в первую очередь в различных ситуациях. Роботы, получив задание, пытаются принять решение, задаваясь вопросами «какова вероятность того, что я добьюсь успеха в том, что собираюсь попробовать?» и «насколько полезной может быть эта вещь». Где-то в промежутке между этими двумя соображениями роботы становятся значительно умнее с каждым днем.

Пока что роботы Google научились приносить различные вещи, вроде газировки, а также вытирать лужи, попутно научившись искать те или иные вещи, открывать ящики и прочее. Но делают они всё правильно в 74 % случаев, и Google работает над тем, чтобы повысить этот показатель. Помимо выполнения различных поручений они также были обучены самостоятельно подключаться к электросети для подзарядки.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Инсайдер: Capcom отложила релиз Resident Evil 9, но в 2025 году может выйти другая игра серии 24 мин.
Звёздный отчёт Alphabet вдохновил инвесторов: у компании быстро растёт выручка и рентабельность 45 мин.
Microsoft получает всё больше выгоды от ИИ — компания показала сильный квартальный отчёт 3 ч.
Газировка с Copilot: Microsoft получила миллиардный контракт на обеспечение Coca-Cola облачными и ИИ-сервисами 3 ч.
Продюсер «Смуты» раскрыл, что добавят в игру с обновлениями, и подтвердил работу над продолжением 3 ч.
ИИ-приложение Google Gemini стало совместимо с Android 10 и Android 11 4 ч.
В США вернули сетевой нейтралитет 5 ч.
Alphabet объявила о первых в своей истории дивидендах, акции выросли в цене на 11,4 % 5 ч.
Младенец-экстрасенс против секретной корпорации: соавторы Before Your Eyes анонсировали сюжетное приключение Goodnight Universe 5 ч.
AMD выпустила драйвер с поддержкой игры Manor Lords и исправлением множества ошибок 11 ч.
IBM представила СХД FlashSystem 5300 и подписку Storage Assurance 15 мин.
Выручка Western Digital выросла на 23 %, но число проданных жёстких дисков продолжает падать 33 мин.
«Закон о чипах» сработал: строительство полупроводниковых заводов в США активизировалось в 15 раз 37 мин.
Blackview представила BL9000 Pro — неубиваемый смартфон со встроенным тепловизором 3 ч.
Meta увеличит инвестиции в развитие инфраструктуры ИИ и готовит крупнейшие капиталовложения в истории компании 3 ч.
HPE построила самый мощный в Польше суперкомпьютер Helios производительностью 35 Пфлопс 3 ч.
AWS построит в Индиане кампус ЦОД стоимостью $11 млрд 3 ч.
США усиливают давление на Японию, Южную Корею и Нидерланды, требуя ужесточить антикитайские санкции 3 ч.
Honor вышел в лидеры китайского рынка смартфонов, на втором месте — Huawei 4 ч.
Samsung заключила контракт с AMD на поставку HBM3E на сумму $3 млрд 4 ч.