Сегодня 13 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ChatGPT обрёл зрение — бот научился на лету понимать видеопоток с камеры смартфона и экрана

OpenAI объявила о появлении у чат-бота ChatGPT на базе генеративного интеллекта способности обрабатывать видеопоток и говорить с пользователями о том, что он «наблюдает» с помощью камеры смартфона или компьютера, либо что видит на экране устройства. Новая функция доступна в расширенном голосовом режиме (Advanced Voice Mode).

 Источник изображения: OpenAI

Источник изображения: OpenAI

О том, что ChatGPT получит функцию компьютерного зрения, позволяющую ему «видеть» при помощи камеры смартфона пользователя или через трансляцию экрана, компания объявила в мае этого года. Теперь доступ к функции расширенного голосового режима ChatGPT с распознаванием видео получили владельцы платных подписок ChatGPT Plus, Team и Pro. По словам компании, подписчики ChatGPT Enterprise и Edu не получат эту функцию до января, и что пока нет графика по её запуску в ЕС, Швейцарии, Исландии, Норвегии и Лихтенштейне.

В недавней демонстрации в программе CNN «60 минут» президент OpenAI Грег Брокман (Greg Brockman) провел тестирование расширенного голосового режима с визуальным распознаванием с участием телеведущего Андерсона Купера (Anderson Cooper) на предмет анатомических навыков чат-бота. Когда Купер рисовал части тела на доске, ChatGPT «понимал», что тот рисует. Вместе с тем ChatGPT в этом режиме допустил ошибку в задаче по геометрии, что говорит о его склонности к галлюцинациям.

После анонса в мае компания несколько раз откладывала запуск расширенного голосового режима с визуальным распознаванием. В апреле OpenAI пообещала, что этот режим будет доступен для пользователей «в течение нескольких недель», но спустя несколько месяцев признала, что на это потребуется больше времени, чем планировалось. И когда расширенный голосовой режим запустили для некоторых пользователей в сентябре, у него не было функции компьютерного зрения.

Компании Google и Meta тоже работают над аналогичными возможностями для своих чат-ботов. На этой неделе Google сделала функцию ИИ для анализа видео в реальном времени Project Astra доступной для группы «доверенных тестировщиков» на платформе Android.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: The First Berserker: Khazan — дёшево, но по-хорошему сердито. Рецензия 4 ч.
Новая статья: Gamesblender № 721: новый шанс для Deus Ex, Switch 2 и цены, скандальное ИИ-демо Quake II 5 ч.
Marathon вышла из тени — дата выхода, много геймплея и короткометражка от оскароносного режиссёра 6 ч.
В Telegram появились групповые звонки на 100 человек со сквозным шифрованием — пока в тестовом режиме 7 ч.
Объём экспорта российского ПО в 2024 году рухнул в полтора раза, но это не точно 13 ч.
Более трети российских компаний удаляют персональные данные вручную 15 ч.
ИИ-лаборатория Meta, создавшая модель Llama, постепенно угасает — в компании назвали это «новым началом» 15 ч.
Двухлетняя модель GPT-4 скоро исчезнет из ChatGPT, уступив место более свежей GPT-4o 22 ч.
ChatGPT обошёл Instagram и TikTok, став самым скачиваемым приложением в мире 23 ч.
Новая статья: inZOI — прощайте, симы. Предварительный обзор 12-04 00:03
Три месяца до Марса: британцы придумали космический буксир на термоядерной тяге 6 ч.
Подорожание iPhone, видеокарт и прочей электроники отменяется — Трамп вывел их из-под действия повышенных пошлин 8 ч.
В 2024 госзакупки ИИ-оборудования увеличились на 150 % до 2,4 млрд рублей 12 ч.
Разработчик оптических чипов-коммутаторов на основе кремниевой фотоники nEye Systems получил на развитие $58 млн 13 ч.
Разработчик охлаждения чипов с помощью лазеров наобещал с три короба и теперь ищет помощи у учёных 13 ч.
Asus представила бюджетную плату X870 MAX Gaming WiFi7 для Ryzen 9000 14 ч.
Asus представила первый в мире 610-Гц геймерский монитор — ROG XG248Q5G-P за $1100 14 ч.
Asus представила геймерский мини-ПК ROG NUC 2025 — Core Ultra 9 и GeForce RTX 5080 в трёхлитровом корпусе за $3335 15 ч.
PowerColor скоро выпустит видеокарту Radeon RX 9070 XT Red Devil с уникальными задними пластинами 15 ч.
Близкую к нам галактику Малое Магелланово Облако прямо сейчас разрывает на части, выяснили японские учёные 15 ч.