Сегодня 21 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ChatGPT обрёл зрение — бот научился на лету понимать видеопоток с камеры смартфона и экрана

OpenAI объявила о появлении у чат-бота ChatGPT на базе генеративного интеллекта способности обрабатывать видеопоток и говорить с пользователями о том, что он «наблюдает» с помощью камеры смартфона или компьютера, либо что видит на экране устройства. Новая функция доступна в расширенном голосовом режиме (Advanced Voice Mode).

 Источник изображения: OpenAI

Источник изображения: OpenAI

О том, что ChatGPT получит функцию компьютерного зрения, позволяющую ему «видеть» при помощи камеры смартфона пользователя или через трансляцию экрана, компания объявила в мае этого года. Теперь доступ к функции расширенного голосового режима ChatGPT с распознаванием видео получили владельцы платных подписок ChatGPT Plus, Team и Pro. По словам компании, подписчики ChatGPT Enterprise и Edu не получат эту функцию до января, и что пока нет графика по её запуску в ЕС, Швейцарии, Исландии, Норвегии и Лихтенштейне.

В недавней демонстрации в программе CNN «60 минут» президент OpenAI Грег Брокман (Greg Brockman) провел тестирование расширенного голосового режима с визуальным распознаванием с участием телеведущего Андерсона Купера (Anderson Cooper) на предмет анатомических навыков чат-бота. Когда Купер рисовал части тела на доске, ChatGPT «понимал», что тот рисует. Вместе с тем ChatGPT в этом режиме допустил ошибку в задаче по геометрии, что говорит о его склонности к галлюцинациям.

После анонса в мае компания несколько раз откладывала запуск расширенного голосового режима с визуальным распознаванием. В апреле OpenAI пообещала, что этот режим будет доступен для пользователей «в течение нескольких недель», но спустя несколько месяцев признала, что на это потребуется больше времени, чем планировалось. И когда расширенный голосовой режим запустили для некоторых пользователей в сентябре, у него не было функции компьютерного зрения.

Компании Google и Meta тоже работают над аналогичными возможностями для своих чат-ботов. На этой неделе Google сделала функцию ИИ для анализа видео в реальном времени Project Astra доступной для группы «доверенных тестировщиков» на платформе Android.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Импортозамещение не помогло: российский рынок ПО вдвое отстал от мирового по темпам роста 2 ч.
На ПК вышла психоделическая шпионская ролевая игра Zero Parades: For Dead Spies от студии-разработчика Disco Elysium 3 ч.
Платное дополнение 2026 Season Pack отправит игроков F1 25 в «новую смелую эру для Формулы-1» — первый трейлер и дата выхода 3 ч.
Импортозамещение в IT принесло российским компаниям 1,6 млрд рублей, но потратили они в 116 раз больше 4 ч.
Масштабная перезагрузка обернулась для Ubisoft рекордными убытками, зато к 2029 году выйдут новые Assassin's Creed, Far Cry и Ghost Recon 5 ч.
Anthropic намерена завершить текущий квартал с прибылью — впервые в своей истории 5 ч.
Аналитики: за пять дней Subnautica 2 стала самой быстро продаваемой игрой 2026 года в Steam, опередив Crimson Desert и Resident Evil Requiem 5 ч.
Вместо Titanfall 3: разработчики Splitgate анонсировали мультиплеерный шутер с титанами Empulse 7 ч.
«Настоящий шаг вперёд»: Cloudflare сравнила Anthropic Mythos с опытным исследователем 7 ч.
Valve назвала абсурдом приравнивание лутбоксов в Counter-Strike к азартным играм 9 ч.
Armada привлекла $230 млн на расширение производства модульных ИИ ЦОД 18 мин.
Глава ASML подтвердил, что Илон Маск очень серьёзно настроен по поводу гигантской фабрики чипов TeraFab 37 мин.
В Японии создали многоразовый фотополимер для 3D-печати — брак можно будет использовать повторно 40 мин.
Cowboy Space подала в FCC заявку на создание орбитальной группировки из 20 тыс. ЦОД 51 мин.
Суд приказал заблокировать все домены Anna’s Archive — крупнейшей пиратской библиотеки в интернете 2 ч.
Представлены процессоры AMD Ryzen AI Max 400 — Zen 5, мощная графика и до 192 Гбайт унифицированной памяти 2 ч.
Память Team Group не выдавала заявленные скорости без ручной настройки BIOS — покупатели получат $1,1 млн компенсации 2 ч.
Космический мусор всё чаще срывает научные наблюдения спутников на орбите 2 ч.
Роботы Figure AI больше недели сортируют посылки в прямом эфире — зрители делают ставки на их поломку 3 ч.
Акции Samsung подскочили на 6 % после постановки на паузу масштабной забастовки 4 ч.