Сегодня 18 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ChatGPT обрёл зрение — бот научился на лету понимать видеопоток с камеры смартфона и экрана

OpenAI объявила о появлении у чат-бота ChatGPT на базе генеративного интеллекта способности обрабатывать видеопоток и говорить с пользователями о том, что он «наблюдает» с помощью камеры смартфона или компьютера, либо что видит на экране устройства. Новая функция доступна в расширенном голосовом режиме (Advanced Voice Mode).

 Источник изображения: OpenAI

Источник изображения: OpenAI

О том, что ChatGPT получит функцию компьютерного зрения, позволяющую ему «видеть» при помощи камеры смартфона пользователя или через трансляцию экрана, компания объявила в мае этого года. Теперь доступ к функции расширенного голосового режима ChatGPT с распознаванием видео получили владельцы платных подписок ChatGPT Plus, Team и Pro. По словам компании, подписчики ChatGPT Enterprise и Edu не получат эту функцию до января, и что пока нет графика по её запуску в ЕС, Швейцарии, Исландии, Норвегии и Лихтенштейне.

В недавней демонстрации в программе CNN «60 минут» президент OpenAI Грег Брокман (Greg Brockman) провел тестирование расширенного голосового режима с визуальным распознаванием с участием телеведущего Андерсона Купера (Anderson Cooper) на предмет анатомических навыков чат-бота. Когда Купер рисовал части тела на доске, ChatGPT «понимал», что тот рисует. Вместе с тем ChatGPT в этом режиме допустил ошибку в задаче по геометрии, что говорит о его склонности к галлюцинациям.

После анонса в мае компания несколько раз откладывала запуск расширенного голосового режима с визуальным распознаванием. В апреле OpenAI пообещала, что этот режим будет доступен для пользователей «в течение нескольких недель», но спустя несколько месяцев признала, что на это потребуется больше времени, чем планировалось. И когда расширенный голосовой режим запустили для некоторых пользователей в сентябре, у него не было функции компьютерного зрения.

Компании Google и Meta тоже работают над аналогичными возможностями для своих чат-ботов. На этой неделе Google сделала функцию ИИ для анализа видео в реальном времени Project Astra доступной для группы «доверенных тестировщиков» на платформе Android.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Дуров после задержания объяснил французской полиции, как правильно направлять запросы к Telegram 4 ч.
Ubisoft случайно устроила утечку сюжетного дополнения A Pirate's Fortune к Star Wars Outlaws — новый трейлер и дата выхода 5 ч.
UserGate расширила экосистему UserGate SUMMA образовательными проектами и ИБ-услугами 7 ч.
Epic Games Store устроил на PC, Android и iOS раздачу очаровательного приключения Botanicula от создателей Samorost 8 ч.
На суде Марк Цукерберг обвинил TikTok в замедлении роста Meta 8 ч.
В работе Telegram произошёл глобальный сбой: приложение не запускается, сообщения не отправляются 8 ч.
Продажи легендарного симулятора колонии дварфов Dwarf Fortress в Steam превысили 1 миллион копий 9 ч.
Google официально признана монополистом в интернет-рекламе 9 ч.
Nvidia снова оплошала: пользователи массово жалуются на новый драйвер GeForce, который должен был исправить 40 проблем 10 ч.
«Уверены, игра будет стоить ожидания»: научно-фантастический шутер Metal Eden от создателей Ruiner не выйдет 6 мая 10 ч.
Новая статья: Обзор и тестирование корпуса DeepCool CH690 Digital: свобода выбора 4 ч.
Китай достиг полного цикла работы первого в мире ториевого реактора 7 ч.
AOC выпустила 27-дюймовый игровой монитор Q27G40XMN с QHD, 180 Гц и подсветкой Mini-LED 9 ч.
Nothing представила наушники CMF Buds 2 с гибридным шумоподавлением и автономностью до 55 часов за  $59 10 ч.
TSMC пообещала треть 2-нм и более тонких чипов выпускать в США, но фабрики будут готовые ещё не скоро 10 ч.
Motorola представила зелёный планшет Moto Pad 60 Pro с Dimensity 8300 и батареей на 10 200 мА·ч за $315 10 ч.
Archer Aviation запустит летающую электромаршрутку между Манхэттеном и ближайшими аэропортами 10 ч.
Tesla ответит в суде за махинации с показаниями одометров для ускоренного истечения гарантии 11 ч.
Seagate утверждает, что HDD гораздо экологичнее SSD с точки зрения углеродных выбросов 11 ч.
Motorola представила свой первый ноутбук — компактный Moto Book 60 с OLED, Intel Core и Wi-Fi 7 11 ч.