Сегодня 26 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ChatGPT обрёл зрение — бот научился на лету понимать видеопоток с камеры смартфона и экрана

OpenAI объявила о появлении у чат-бота ChatGPT на базе генеративного интеллекта способности обрабатывать видеопоток и говорить с пользователями о том, что он «наблюдает» с помощью камеры смартфона или компьютера, либо что видит на экране устройства. Новая функция доступна в расширенном голосовом режиме (Advanced Voice Mode).

 Источник изображения: OpenAI

Источник изображения: OpenAI

О том, что ChatGPT получит функцию компьютерного зрения, позволяющую ему «видеть» при помощи камеры смартфона пользователя или через трансляцию экрана, компания объявила в мае этого года. Теперь доступ к функции расширенного голосового режима ChatGPT с распознаванием видео получили владельцы платных подписок ChatGPT Plus, Team и Pro. По словам компании, подписчики ChatGPT Enterprise и Edu не получат эту функцию до января, и что пока нет графика по её запуску в ЕС, Швейцарии, Исландии, Норвегии и Лихтенштейне.

В недавней демонстрации в программе CNN «60 минут» президент OpenAI Грег Брокман (Greg Brockman) провел тестирование расширенного голосового режима с визуальным распознаванием с участием телеведущего Андерсона Купера (Anderson Cooper) на предмет анатомических навыков чат-бота. Когда Купер рисовал части тела на доске, ChatGPT «понимал», что тот рисует. Вместе с тем ChatGPT в этом режиме допустил ошибку в задаче по геометрии, что говорит о его склонности к галлюцинациям.

После анонса в мае компания несколько раз откладывала запуск расширенного голосового режима с визуальным распознаванием. В апреле OpenAI пообещала, что этот режим будет доступен для пользователей «в течение нескольких недель», но спустя несколько месяцев признала, что на это потребуется больше времени, чем планировалось. И когда расширенный голосовой режим запустили для некоторых пользователей в сентябре, у него не было функции компьютерного зрения.

Компании Google и Meta тоже работают над аналогичными возможностями для своих чат-ботов. На этой неделе Google сделала функцию ИИ для анализа видео в реальном времени Project Astra доступной для группы «доверенных тестировщиков» на платформе Android.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Российская «дочка» Microsoft подала заявление о банкротстве 26 мин.
GPT-5 обещает серьёзный прогресс в практическом программировании и разработке ПО 8 ч.
Microsoft назвала Windows 11 24H2 самой стабильной за всю историю, что бы это ни значило 8 ч.
Новая статья: Tony Hawk’s Pro Skater 3 + 4 — кажется, вы что-то забыли. Рецензия 8 ч.
ВТБ провёл крупнейшее в России импортозамещение системы управления знаниями 9 ч.
Plants vs. Zombies Replanted скоро выйдет из тени — инсайдер раскрыл дату выхода переиздания культовой игры о противостоянии растений и зомби 9 ч.
Вышел релиз обновлённого «Кибер Хранилища» с массой оптимизаций для работы с кластерами S3 10 ч.
Microsoft рассказала, что ждёт Copilot в будущем: ИИ будет «жить», «стареть» и получит собственную комнату 11 ч.
«История про убийство нацистов всегда в моде»: Amazon запустила в производство сериал по Wolfenstein 11 ч.
Как много чемпионов: Bethesda похвасталась новыми успехами The Elder Scrolls IV: Oblivion Remastered 12 ч.
Американские регуляторы прекратили расследование в отношении аномального поведения беспилотных такси Waymo 29 мин.
В Калифорнии роботакси Tesla превратятся в обычные, поскольку за рулём потребуется водитель 57 мин.
Intel подыщет для сетевого подразделения внешних инвесторов 2 ч.
Потенциальный отказ Intel от передовой литографии вызвал обвал акций компании на 8 % 3 ч.
Проект Tesla Optimus сталкивается с проблемами и отстаёт от графика, но Маск и инвесторы сохраняют оптимизм 7 ч.
Несмотря на запреты США в Китай «просочились» передовые ускорители NVIDIA на $1 млрд 7 ч.
Смарт-часы под брендом Pebble снова появятся на рынке 8 ч.
DJI готовится к выходу на рынок роботов-пылесосов — первый продукт уже готов 8 ч.
SK Hynix запустит производство чипов GDDR7 ёмкостью 3 Гбайт — идеально для GeForce RTX 50 Super 8 ч.
Lian Li выпустила компактный корпус-аквариум O11D MINI V2 с поддержкой массивных видеокарт 11 ч.