Сегодня 20 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → openai
Быстрый переход

ChatGPT показал сильнейший в истории скачок выручки у мобильного приложения после запуска GPT-4o

Запуск OpenAI флагманской модели GPT-4o привёл к самому большому за всю историю росту доходов компании от мобильных устройств, хотя сама модель находится в свободном доступе в Сети. GPT-4o умеет обрабатывать текст, речь и видео, и эмоционально реагирует голосом в реальном времени. Согласно данным аналитической компании Appfigures, это нововведение подталкивает всё больше пользователей к переходу на платную подписку ChatGPT Plus.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Хотя OpenAI заявила, что генеративная модель GPT-4o будет доступна пользователям бесплатно, это обещание не распространяется на пользователей приложения ChatGPT на мобильных устройствах. Для использования последней версии чат-бота им придётся оформить ежемесячную подписку ChatGPT Plus за $19,99.

Это решение OpenAI породило повышенный спрос на подписку среди мобильных пользователей и привело к самому большому за всю историю росту доходов OpenAI от мобильных устройств. По информации Appfigures, чистый доход от мобильного приложения ChatGPT увеличился на 22 % в день запуска GPT-4o и продолжил рост в последующие дни. Чистый доход от приложения на следующий день после запуска GPT-4o составил $900 000, что почти вдвое превышает средний дневной доход в $491 000. Цифры дохода указаны после уплаты комиссионных Apple и Google.

 Источник изображения: Appfigures

Источник изображения: Appfigures

На прошлой неделе, с понедельника по пятницу, мобильное приложение ChatGPT заработало $4,2 млн выручки в App Store и Google Play. Это самый большой скачок доходов, который когда-либо демонстрировало приложение. Резкое увеличение выручки показывает наличие реального потребительского спроса на новейшие ИИ-технологии, даже если это дороже, чем подписка на Netflix. По мнению экспертов, эта тенденция в дальнейшем сохранится или даже усилится.

OpenAI отключила в ChatGPT голос Sky в из-за удивительного сходства с голосом Скарлетт Йоханссон

Голос Sky стал доступен в ChatGPT сразу после запуска голосовых функций чат-бота в сентябре 2023 года наряду с ещё четырьмя вариантами озвучения: Breeze, Cove, Ember и Juniper. Особую значимость эти функции приобрели после презентации новой модели ChatGPT-4o, сделавшей голосового помощника более выразительным. После многочисленных сообщений о сходстве тембра и интонаций Sky с голосом Скарлетт Йоханссон, разработчик ChatGPT компания OpenAI «поставила голос Sky на паузу».

 Источник изображения: kinopoisk.ru

Источник изображения: kinopoisk.ru

«Мы считаем, что голоса ИИ не должны намеренно имитировать характерный голос знаменитости — голос Sky не является имитацией Скарлетт Йоханссон, а принадлежит другой профессиональной актрисе, использующей свой собственный естественный голос», — заявил сегодня утром представитель OpenAI.

По утверждению OpenAI, подбор голосов проводился в течение пяти месяцев с участием профессиональных актёров озвучения, кастинг-директоров и отраслевых экспертов. Из соображений конфиденциальности имя актрисы, чей голос так похож на голос Йоханссон, компания не раскрывает.

Технический директор OpenAI Мира Мурати опровергла утверждение, что имитация голоса Йоханссон была преднамеренной. Однако, судя по сообщению генерального директора OpenAI Сэма Альтмана (Sam Altman) в социальной сети X из одного слова: «Она», похоже, что он был в курсе ситуации. Альтман ранее говорил, что одним из его любимых фильмов является «Она», в котором Скарлетт Йоханссон озвучивает виртуальную помощницу.

 Источник изображения: Warner Bros

Источник изображения: Warner Bros

Существует вероятность, что для Sky сознательно подбирался голос озвучения, максимально схожий с голосом Скарлетт Йоханссон. Сама актриса сложившуюся ситуация не комментирует. Перспектива судебных разбирательств представляется весьма туманной — OpenAI достаточно будет предоставить суду персональные данные актрисы, озвучившей Sky.

Новые возможности голосового помощника ChatGPT будут запущены «в ближайшие недели» в качестве ограниченной альфа-версии для подписчиков ChatGPT Plus. OpenAI планирует со временем ввести дополнительные голоса, чтобы «лучше соответствовать разнообразным интересам и предпочтениям пользователей».

Apple и OpenAI объявят о сотрудничестве на конференции WWDC в июне

Ежегодная конференция для разработчиков Apple WWDC в этом году начнётся 10 июня. Ожидается, что в рамках этого мероприятия производитель iPhone сделает несколько важных анонсов касательно того, какие функции на основе искусственного интеллекта ждут пользователей устройств компании. По сообщениям сетевых источников, Apple также официально объявит о сотрудничестве с OpenAI, разработчиком популярного ИИ-бота ChatGPT.

 Источник изображения: Koshiro K / Shutterstock

Источник изображения: Koshiro K / Shutterstock

В сообщении сказано, что Apple намерена реализовывать поддержку функций на основе ИИ не только на пользовательских устройствах, но и через облачную инфраструктуру. По данным журналиста издания Bloomberg Марка Гурмана (Mark Gurman), Apple и OpenAI «готовят важное объявление о своём партнёрстве на WWDC». Он также добавил, что в настоящее время OpenAI оценивает мощности доступных ресурсов, чтобы убедиться в том, что компания справится с притоком новых клиентов, который обеспечат владельцы iPhone.

Ранее СМИ стало известно о том, что компании находятся в завершающей стадии переговоров по реализации поддержки ИИ-бота ChatGPT на iOS 18. Похоже, что переговоры прошли успешно. Сообщалось также, что Apple вела переговоры с Google об использовании алгоритма Gemini на iPhone, но компании не достигли договорённости.

Ожидается, что помимо интеграции технологий OpenAI в iOS 18 будут анонсированы и другие ИИ-функции, такие как возможность обобщать сообщения в iMessage с помощью нейросети. Аналогичная функция для браузера Safari будет формировать резюмирующую информацию о просматриваемых веб-страницах.

Руководители OpenAI обещают развивать ИИ ответственно, хотя специалисты в этой сфере уволились

После недавней и неожиданной отставки двух ключевых фигур из отдела ИИ-безопасности OpenAI, руководители компании вынуждены были занять оборонительную позицию, так как к ним появилось много вопросов со стороны общественности в отношении стратегии рисков при разработке искусственного интеллекта.

 Источник изображения: Copilot

Источник изображения: Copilot

Ушедшие руководители — главный научный сотрудник Илья Суцкевер (Ilya Sutskever) и его коллега Ян Лейке (Jan Leike) — были частью суперкоманды OpenAI, отвечающей за разработку ИИ, совместимого с интересами человечества. Их уход, предположительно, был вызван разногласиями с руководством компании по поводу обеспечения глобального приоритета безопасности, чтобы «ИИ не разрушил мир».

Лейке прямо заявил, что давно не согласен с руководством в этих вопросах и что ситуация достигла критической точки. А Суцкевер даже пытался сместить гендиректора Сэма Альтмана (Sam Altman) с поста в прошлом году, хотя позднее выразил сожаление в своих действиях.

После их ухода общественность забила тревогу по поводу приоритетов OpenAI в плане безопасности. В ответ Альтман и президент Грег Брокман (Greg Brockman) опубликовали подробные заявления, объясняющие подход компании.

Они подчеркнули, что OpenAI уже внесла большой вклад в обеспечение безопасного развития ИИ, в частности, призывали к международному регулированию еще до того, как это стало мейнстримом. Альтман также предлагал создать международное агентство для обеспечения разумного тестирования систем ИИ.

Брокман заверил, что OpenAI тщательно анализирует риски на каждом этапе разработки и не планирует публиковать новые системы, пока компания не будет уверена в их безопасности, даже если это задержит выпуск.

Однако ушедшие руководители отдела ИИ-безопасности, похоже, обеспокоены тем, что текущий подход не обеспечивает достаточной защиты. По словам Лейке, эти проблемы очень сложно решать, и он обеспокоен, что компания не движется в правильном направлении в этом вопросе.

Несмотря на заверения руководства, уход ключевых специалистов ставит под сомнение заявления OpenAI о глобальной безопасности ИИ.

Президент OpenAI опубликовал изображение, созданное GPT-4o — оно очень впечатляет

На этой неделе OpenAI представила модель искусственного интеллекта нового поколения GPT-4o. Буква «o» в её названии означает Omni, подразумевая, что она изначально поддерживает несколько форматов ввода — ранее мультимодальность предполагала преобразование всех нетекстовых форматов в текст. Президент и соучредитель OpenAI Грег Брокман (Greg Brockman) впервые опубликовал созданное GPT-4o изображение.

 Источник изображения: twitter.com/gdb

То самое сгенерированное GPT-4o изображение. Источник изображения: twitter.com/gdb

Поддержка текста, изображений и звука в качестве входных данных означает, что модель также способна их генерировать. Приведённая выше картинка — не фотография, а творение GPT-4o. На ней изображён мужчина в футболке с логотипом OpenAI, который пишет на доске. Сверху находится частично стёртая надпись «Перенос между модальностями». Далее следует текст: «Положим, мы напрямую моделируем P (текст, пиксели, звук) посредством одного авторегрессионного трансформера. Каковы за и против?».

Если присмотреться, можно разглядеть некоторые признаки того, что изображение было создано ИИ. Доска висит под неестественным углом, под ней непонятным образом находится ещё одна, рука мужчины имеет странную форму, а освещение неоднородно. Невероятной, вместе с тем, кажется способность ИИ генерировать длинные фрагменты связного текста — с этим с трудом справляется даже DALL-E 3. Генератор изображений GPT-4o широкой публике пока недоступен: пользователи ChatGPT с подключённой моделью нового поколения пока могут генерировать изображения лишь с DALL-E 3. Но президент OpenAI Грег Брокман уверяет, что компания прилагает значительные усилия, чтобы открыть к модели нового поколения полный доступ.

ChatGPT научился напрямую загружать файлы из «Google Диска» и Microsoft OneDrive

Компания OpenAI сообщила, чат-бот ChatGPT сможет загружать и анализировать данные с облачных хранилищ «Google Диск» и Microsoft OneDrive без необходимости их скачивания и последующей загрузки в чат-бот. OpenAI выпустит соответствующее обновление в ближайшие недели.

 Источник изображений: OpenAI

Источник изображений: OpenAI

Функция загрузки данных для анализа из «Google Диска» и Microsoft OneDrive станет доступна пользователям платных подписок ChatGPT Plus, Enterprise и Teams. Для этого необходимо будет предоставить чат-боту доступ к учётной записи указанных облачных сервисов. Как объясняет OpenAI в своём блоге, за счёт новой функции чат-бот сможет быстрее просматривать и анализировать файлы Excel, Word, PowerPoint и их эквиваленты от Google. На данный момент функции анализа данных доступны только через GPT-4o — улучшенную версию GPT-4.

OpenAI также улучшила способность ChatGPT понимать информацию из инструкций, написанных на естественном языке. Пользователи могут попросить чат-бота проанализировать код на Python, объединить или очистить наборы данных, а также создать диаграмму на основе информации, содержащейся в том или ином файле.

ChatGPT и ранее мог создавать графики и таблицы по запросу, однако теперь он позволяет с ними взаимодействовать — расширять с помощью дополнительных ячеек, а также настраивать визуализацию данных с помощью цветов. Сейчас ChatGPT поддерживает визуализацию для гистограмм, линейных, круговых и точечных диаграмм. Для остальных, он будет создавать статичные версии этих элементов без возможности редактирования.

В своём блоге OpenAI также напомнила, что не будет обучать свои ИИ-модели на основе данных, которые загружают пользователи ChatGPT Enterprise и Teams. Подписчики ChatGPT Plus, в свою очередь, могут отказаться от функции обучения.

Команда специалистов OpenAI по защите человечества от угроз, связанных с ИИ, просуществовала менее года

Уход из OpenAI одного из основателей этого стартапа Ильи Суцкевера, как поясняет CNBC, стал одной из причин распада команды специалистов по управлению долгосрочными рисками, связанными с внедрением искусственного интеллекта. Эта структурная единица, призванная защитить человечество от угроз, возникающих в связи с распространением ИИ, не просуществовала в OpenAI и одного года.

 Источник изображения: Университет Торонто

Источник изображения: Университет Торонто

По данным CNBC, озабоченность подобными рисками уже давно проявлял сам Илья Суцкевер (на фото выше), руководивший в OpenAI научными изысканиями и исследованиями. Он же возглавлял и профильную команду по управлению рисками вместе с Яном Лейке (Jan Leike), но последний на уходящей неделе тоже покинул штат компании. Сформированная в прошлом году команда, как изначально подразумевалась, будет следить за минимизацией рисков, связанных с распространением технологий искусственного интеллекта, и OpenAI намеревалась выделить до 20 % своих вычислительных ресурсов для этих нужд в течение ближайших четырёх лет. После ухода руководителей команды её оставшиеся члены были назначены на другие позиции внутри компании.

Вчера Ян Лейке заявил, комментируя свой уход из OpenAI, что «культура безопасности и процессы уступили место сияющим продуктам». Как и в случае с уходом Ильи Суцкевера, действующий генеральный директор OpenAI Сэм Альтман (Sam Altman) выразил сожаление по поводу отставки Яна Лейке. По словам последнего, он уже длительное время не разделял взглядов руководства на приоритетные направления развития компании, и теперь эти противоречия достигли критического значения. Как он считает, OpenAI должна уделять больше внимания безопасности и влиянию создаваемых технологий на общество. На протяжении последних нескольких месяцев профильная команда внутри OpenAI, по словам Лейке, буквально «шла по воде под парусом против ветра». Достигать поставленных задач становилось всё сложнее, специалисты были очень ограничены в ресурсах. Лейке по-прежнему убеждён, что OpenAI должна в разработке генеративного искусственного интеллекта быть компанией, ставящей безопасность во главу угла, поскольку «создание машин, превосходящих людей — это очень опасная затея».

Как поясняет Bloomberg, компания OpenAI сохранит в своём штате специалистов, которые следят за безопасностью искусственного интеллекта, но они будут рассредоточены по различным подразделениям. Схожими функциями будут наделены и обособленные подразделения стартапа, поэтому говорить о полностью бесконтрольном развитии ИИ в новых условиях не приходится.

Reddit откроет OpenAI доступ к контенту для обучения ИИ

OpenAI подписала соглашение о доступе к контенту Reddit в реальном времени через API — это значит, что компания сможет отображать обсуждения с сайта в ChatGPT и других новых продуктах. Ранее аналогичное соглашение администрация Reddit заключила с Google — тогда сделку оценили в $60 млн.

 Источник изображения: redditinc.com

Источник изображения: redditinc.com

Соглашение также поможет администрации платформы «предоставить пользователям и модераторам Reddit новые функции на основе искусственного интеллекта», а также использовать большие языковые модели OpenAI для создания приложений. OpenAI, кроме того, станет рекламным партнёром Reddit. Пользователи крупнейшего в мире форума никогда не стеснялись высказываться о том, как руководство платформы управляет ей, и неизвестно, как они отреагируют на сделку с OpenAI. В прошлом году более 7000 разделов сайта отключились в знак протеста против введения платного API. Аналогичным образом у платформы для программистов Stack Overflow после заключения сделки с OpenAI без конфликтов с пользователями не обошлось.

Reddit не раскрыла финансовых условий сделки, и ни одна из двух компаний не рассказала о наборе данных для обучения ИИ. Сообщая о сделке с Google, руководство платформы открыто говорило о «более эффективных способах обучения моделей». В случае с OpenAI всё обстоит несколько иначе: во-первых, глава компании Сэм Альтман (Sam Altman) является акционером Reddit; во-вторых, известно, что «партнерский проект возглавил главный операционный директор OpenAI с одобрения независимым советом директоров».

«Reddit стал одним из крупнейших в интернете архивов аутентичных и актуальных разговоров людей обо всём. Его включение в ChatGPT поддерживает нашу веру в интернет — это поможет людям находить, что они ищут, и поможет новой аудитории найти сообщество на Reddit», — заявил гендиректор платформы Стив Хаффман (Steve Huffman). Прежде администрация форума не всегда приветствовала сбор его данных для обучения ИИ. Она грозилась заблокировать роботам Google доступ к сайту. А OpenAI однажды заявила модераторам форума, посвящённого ChatGPT, что они нарушили авторские права компании, использовав в качестве эмблемы логотип чат-бота.

Google разберётся с OpenAI за использование YouTube для обучения ИИ

Генеральный директор Google Сундар Пичаи (Sundar Pichai) пообещал «разобраться», если выяснится, что OpenAI использовала контент YouTube при обучении модели искусственного интеллекта, которая может генерировать видео. Он сообщил, что Google располагает всеми необходимыми инструментами и технологиями, чтобы выяснить, соблюдает ли OpenAI правила. По информации газеты New York Times, OpenAI при обучении моделей ИИ использовала более миллиона часов видео с YouTube.

 Источник изображения: Pixabay

Источник изображения: Pixabay

«Послушайте, я думаю, что это вопрос, на который они должны ответить, — заявил Пичаи в интервью CNBC, когда его спросили, может ли компания подать в суд. — Мне нечего добавить. У нас есть чёткие условия обслуживания. Мы взаимодействуем с компаниями и следим за тем, чтобы они следовали нашим условиям обслуживания. И мы во всем разберёмся».

В марте представитель OpenAI Мира Мурати (Mira Murati) в интервью Wall Street Journal сообщила, что она не уверена, являются ли видеоролики YouTube частью обучающих данных для модели ИИ Sora, представленной OpenAI ранее в этом году. По мнению Мурати, OpenAI опиралась на «общедоступные и лицензированные данные». Позже газета New York Times, ссылаясь на достоверные источники, утверждала, что OpenAI «записала более миллиона часов видео с YouTube».

Пичаи дал интервью сразу после основного доклада на конференции Google I/O, где компания анонсировала новые модели генеративного ИИ, в том числе Veo, способную создавать полноценные видеоролики. Пока эта модель доступна только пользователям, получившим одобрение от Google. Пичаи также анонсировал мультимодальный ИИ-помощник Project Astra, который должен появятся в нейросети Google Gemini позднее в этом году.

По словам Пичаи, Google сократила стоимость обслуживания моделей ИИ при веб-поиске на 80 %, используя собственные тензорные процессоры (TPU) и ускорители ИИ Nvidia. В ближайшее время компания начнёт отображать сводки ИИ в результатах поиска для всех пользователей в США. «У нас есть чёткое представление о том, как к этому подойти, и мы сделаем все правильно», — заявил Пичаи.

В марте стало известно, что Apple обсуждает идею использования модели ИИ Gemini в iPhone. По словам Пичаи, Google на протяжении многих лет поддерживает «прекрасное партнёрство с Apple». «Мы сосредоточились на предоставлении отличных возможностей для экосистемы Apple, — заявил он. — И поэтому мы продолжим работать над воплощением ИИ-технологий в жизнь». Сотрудничество с Apple настолько важно для Google, что поисковый гигант отдаёт Apple 36 % доходов от контекстной рекламы в браузере Safari.

 Источник изображения: Getty Images

Источник изображения: Getty Images

OpenAI на один день опередила мероприятие Google. Компания представила модель искусственного интеллекта под названием GPT-4o и показала, как пользователи мобильного приложения ChatGPT могут в формате естественного диалога общаться с ИИ-помощником, который «на лету» анализирует объекты, снимаемые камерой смартфона. OpenAI сообщила, что подписчики ChatGPT с тарифным планом Plus смогут опробовать предварительную версию нового голосового режима «в ближайшие недели».

Один из основателей OpenAI Илья Суцкевер объявил об уходе из компании

В прошлом году руководящий разработками и исследованиями в OpenAI Илья Суцкевер (Ilya Sutskever) выразил несогласие с политикой генерального директора Сэма Альтмана (Sam Altman), и сперва выступил одним из инициаторов его отставки, но потом быстро перешёл на сторону тех, кто настаивал на его возвращении. На этой неделе стало известно о намерениях Суцкевера покинуть OpenAI для работы над новым проектом.

 Источник изображения: Nvidia

Источник изображения: Nvidia

На страницах социальной сети X, как сообщает CNBC, Илья Суцкевер (на фото справа) весьма скупо охарактеризовал свою новую инициативу, отметив лишь, что она имеет для него «очень личное значение», и пообещав поделиться подробностями позже. Послужили ли причиной ухода Суцкевера накопившиеся противоречия с руководством стартапа, не уточняется. Напомним, что в ноябре он настаивал на вдумчивом внедрении технологий искусственного интеллекта, делая упор на исключении вреда от них для человечества, тогда как руководящий OpenAI Сэм Альтман во главу угла ставил высокие темпы развития технологий. Суцкеверу пришлось тогда покинуть совет директоров компании, но Альтман публично выражал свою преданность коллеге даже после некрасивой истории со своей отставкой, и выражал надежду, что сможет работать с Ильёй на протяжении всей своей оставшейся карьеры.

Глава OpenAI выразил сожаление по поводу ухода Илья Суцкевера из этой компании, назвав его не только одним из выдающихся умов современности, но и близким другом. Ведущим научным сотрудником OpenAI после ухода Ильи станет Якуб Пачоцки (Jakub Pachocki), который до недавних пор руководил разработками в этом стартапе. Новости о кадровых перестановках в компании прозвучали сразу после анонса новой большой языковой модели ChatGPT-4o. Как показало судебное расследование, в 2015 году определённую роль в привлечении Суцкевера в ряды основателей OpenAI сыграл Илон Маск (Elon Musk), который позже покинул стартап и недавно организовал конкурирующий xAI. В то время Илья Суцкевер занимался научными изысканиями в Google, но Маск убедил его перейти в OpenAI.

Google ответила на GPT-4o демонстрацией коммуникативных способностей Gemini — нейросеть ведёт диалог как человек

Вслед за презентацией модели GPT-4o от OpenAI, компания Google продемонстрировала коммуникативные способности нейросети Gemini на Pixel. Демонстрационное видео, показанное перед конференцией Google I/O, производит сильное впечатление. Gemini ведет разговор с пользователем и делает логические выводы без малейших задержек и ошибок.

 Источник изображения: Solen Feyissa/Unsplash

Источник изображения: Solen Feyissa/Unsplash

Как пишет Tom’s Guide, в демо Gemini отвечает на вопросы о происходящем на подготавливаемой сцене для мероприятия. Он правильно определяет, что это сцена для предстоящей конференции Google I/O, и дает краткое описание этого ежегодного события.

Подобно недавней демонстрации ChatGPT, видео с Gemini впечатляет естественностью диалога. Кажется, будто за голосом стоит человек, а не искусственный интеллект. Обе модели демонстрируют огромный прогресс в разработке ИИ за последнее время.

Тем не менее, Google не раз критиковали за чрезмерно оптимистичное представление своих разработок в области ИИ. В прошлом некоторые анонсированные функции на практике оказались менее впечатляющими. Поэтому еще предстоит дополнительное тестирование, чтобы понять реальные возможности и ограничения системы.

В то же время успехи Google и OpenAI вызывают опасения у экспертов и общественных деятелей. Особенно в контексте недавнего скандала с моделью LaMDA от Google, которая, по утверждению инженера этой компании, «обрела сознание». Хотя большинство ученых опровергают эту гипотезу, вопросы этики и безопасности подобных систем остаются открытыми.

Например, ChatGPT от OpenAI уже продемонстрировал способность к предвзятости, токсичности и распространению дезинформации. А Gemini, вероятно, унаследует эти недостатки от GPT-4, учитывая общие принципы работы нейросетевых моделей. Помимо этого, появление ИИ, способного проходить тест Тьюринга и имитировать человеческое поведение, открывает дорогу для злоупотреблений. Например, использование таких систем для автоматического распространения фейковых новостей и социальной инженерии или внедрение в цифровые продукты «дружелюбных» ботов, манипулирующих пользователями в интересах компаний.

OpenAI обновила интерфейс ChatGPT — теперь это чёрная дыра

OpenAI обновила интерфейс ChatGPT, сделав его минималистичным. Теперь пользователь будет «общаться» с большой чёрной точкой, которая изменяется в зависимости от происходящих событий. Когда ИИ говорит, круг меняется, визуально усиливая ощущение диалога и взаимодействия.

 Источник изображения: OpenAI

Источник изображения: OpenAI

По словам технического директора OpenAI Миры Мурати (Mira Murati), новый интерфейс должен свести к минимуму отвлекающие факторы, чтобы пользователи могли полностью сосредоточиться на диалоге с ИИ. Чёрный круг, выступающий в роли собеседника, превращается в стилизованные волны звука, когда ChatGPT даёт ответ. Это визуально усиливает у пользователя ощущение коммуникации.

Интересно, что выбор минималистичного дизайна в духе Apple может показаться смелым и неожиданным, но, похоже, он основан на тщательном анализе. Более яркие цвета или образ человека могут отвлекать и даже вызывать дискомфорт, а вот нейтральный чёрный круг, как считают разработчики OpenAI, универсален и легко адаптируем для отображения в дальнейшем новых функций ChatGPT.

При этом такая простая геометрическая форма помогает избежать самых тревожных ассоциаций с «всевидящим и всезнающим» ИИ из мира научной фантастики. Например, нельзя не вспомнить компьютер HAL 9000 с его красным «глазом» из фильма Стэнли Кубрика «Космическая одиссея 2001 года». Или же суперкомпьютер-провидец «Небесная машина» из романов Артура Кларка (Arthur Clarke), который фактически управлял всем человечеством.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Как отмечает Techcrunch, упрощенный интерфейс, основанный на простой форме, похоже, хорошо вписывается в общий тренд в индустрии ИИ. Компании вроде Apple, Meta и другие также экспериментируют с минималистичными аватарками для своих голосовых помощников. По сравнению с некоторыми из них, круг ChatGPT выглядит даже довольно скромно.

Пока обновленный интерфейс будет доступен только для настольных и мобильных приложений ChatGPT. В веб-версии по-прежнему используется стандартный текстовый интерфейс.

OpenAI представила ИИ-модель GPT-4o — она гораздо умнее старых версий и будет доступна бесплатно

OpenAI представила мощную мультимодальную модель генеративного искусственного интеллекта (ИИ) GPT-4o, которая будет внедрена в её решения для разработчиков и потребителей в течение следующих нескольких недель. Буква «о» в названии GPT-4o означает omni (всесторонний), что указывает на мультимодальность GPT-4o.

 Источник изображений: OpenAI

Источник изображений: OpenAI

Технический директор OpenAI Мира Мурати (Mira Murati) сообщила в ходе презентации продукта в офисе OpenAI в Сан-Франциско (США), что GPT-4o имеет интеллект «уровня GPT-4», но более высокие возможности в работе с текстом и изображениями, а также с аудио. «GPT-4o воспринимает голос, текст и визуальные образы, — сообщила Мурати. — И это невероятно важно, поскольку мы думаем о будущем взаимодействии между нами и машинами».

Её предшественница — GPT-4 Turbo — обучалась на сочетании изображений и текста. Она способна анализировать изображения и текст для выполнения таких задач, как извлечение текста из изображений и даже описание содержимого этих изображений. В свою очередь, в GPT-4o к этим возможностям добавили речь. GPT-4o получил контекстное окно в 128 тысяч токенов.

Сообщается, что GPT-4o позволит значительно улучшить работу ИИ-чат-бота ChatGPT. Последний уже давно поддерживает голосовой режим, в котором ответы чат-бота расшифровываются с использованием модели преобразования текста в речь, но GPT-4o усилит эту функцию, позволяя пользователям взаимодействовать с чат-ботом больше как с помощником. Например, ему можно будет задать вопрос и прервать его, когда он отвечает. По словам OpenAI, модель GPT-4o обеспечивает реагирование «в реальном времени» и может даже улавливать эмоции в голосе пользователя, генерируя в ответ голос «в различных эмоциональных стилях» в соответствии с текущей ситуацией.

GPT-4o также улучшит визуальные возможности ChatGPT. Исходя из предложенной фотографии или экрана рабочего стола, ChatGPT теперь сможет быстро отвечать на сопутствующие вопросы: от «Что происходит в этом программном коде» до «Какую рубашку какого бренда носит этот человек?».

В дальнейшем возможности модели будут расширяться. Если сейчас GPT-4o позволяет, например, переводить сфотографированное меню на другой язык, то в будущем с её помощью ChatGPT сможет «смотреть» спортивную игру в прямом эфире и объяснять вам правила, говорит Мурати.

Начиная с сегодняшнего дня GPT-4o доступна как платным, так и бесплатным пользователям ChatGPT, но для подписчиков платных тарифных планов ChatGPT Plus и Team ограничение на количество сообщений будет «в 5 раз выше». При превышении лимита ChatGPT автоматически переключится на GPT-3.5 у бесплатных пользователей и на GPT-4 у платных.

Бесплатным пользователям ChatGPT при взаимодействии с GPT-4o станут доступны некоторые функции, которые прежде были только у платных подписчиков. В частности, обновлённый чат-бот сможет искать информацию не только в своей ИИ-модели, но также в интернете; анализировать данные и создавать графики; работать с пользовательскими изображениями и файлами; а также лучше помнить прежние взаимодействия с пользователем. Также бесплатные пользователи получат доступ к GPT Store.

OpenAI сообщила, что GPT-4o поддерживает больше языков, с улучшенной производительностью на 50 различных языках. В API OpenAI GPT-4o в два раза быстрее, чем GPT-4 (в частности, GPT-4 Turbo), вдвое дешевле и имеет более высокие лимиты по скорости.

В настоящее время поддержка голосового общения не включена в API GPT-4o для всех клиентов. OpenAI пояснила, что из-за риска неправильного использования планирует впервые запустить в ближайшие недели поддержку новых аудиовозможностей GPT-4o для «небольшой группы доверенных партнёров».

OpenAI представит ИИ-ассистента с пониманием сарказма и добавит в ChatGPT звонки

Компания OpenAI может вскоре представить цифрового помощника с поддержкой мультимодального искусственным интеллектом. Как сообщает ресурс The Information, новый ассистент OpenAI способен даже распознать сарказм.

 Источник изображения: Mariia Shalabaieva/unsplash.com

Источник изображения: Mariia Shalabaieva/unsplash.com

По данным источников The Information, OpenAI продемонстрировала ряду клиентов новую мультимодальную ИИ-модель, способную как вести диалог с пользователем, так и распознавать объекты. Не исключено, что она будет представлена завтра, 13 мая, на мероприятии, которое начнётся в 20:00 мск.

Новая модель обеспечивает более быструю и точную интерпретацию изображений и аудио по сравнению с существующими ИИ-моделями для транскрипции или преобразования текста в речь. Как предполагает The Information, она может помочь сотрудникам службы поддержки клиентов «лучше понимать интонацию голосов звонящих или то, саркастичны ли они». «Теоретически» модель может помочь студентам в решении задач по математике или переводе реальных обозначений. По словам источников ресурса, новая ИИ-модель может превзойти GPT-4 Turbo в «ответах на некоторые типы вопросов», но все же будет более склонна к ошибочным решениям.

По словам разработчика Ананая Ароры (Ananay Arora), OpenAI также готовится добавить чат-боту ChatGPT функцию телефонных звонков. Арора утверждает, что нашёл доказательства того, что OpenAI уже предусмотрела использование серверов для аудио- и видеосвязи в реальном времени.

Следует отметить, что этой функции не будет у модели GPT-5, если её вдруг представят на следующей неделе, поскольку гендиректор Сэм Альтман (Sam Altman) отрицает тот факт, что предстоящее мероприятие будет иметь какое-либо отношение к последователю ИИ-модели GPT-4. Он также опроверг слухи о том, что компания на следующей неделе представит новую поисковую систему на базе ИИ.

Глава OpenAI опроверг слухи о запуске ИИ-поисковика на следующей неделе

Глава OpenAI Сэм Альтман (Sam Altman) опроверг сообщение Reuters о том, что компания в следующий понедельник, за день до конференции Google I/O, представит свой собственный ИИ-поисковик, который будет позиционироваться как потенциальный конкурент поисковику Google и ИИ-поисковику стартапа Perplexity.

 Источник изображения: OpenAI

Источник изображения: OpenAI

На своей станице в соцсети X Альтман подтвердил, что компания действительно собирается представить некий новый продукт, который, по его мнению, «ощущается словно магия», но это «не GPT-5 и не поисковый движок».

Альтман также ретвитнул сообщение официального канала OpenAI, в котором говорится, что компания в понедельник, в 10:00 утра по местному времени (20:00 мск) расскажет о свежих обновлениях для чат-бота ChatGPT и языковой модели GPT-4.

По информации The Verge, OpenAI активно пытается переманивать сотрудников Google в свою команду, которая ведёт разработку некоего нового продукта. Издания Bloomberg и The Information ранее сообщали, что речь может идти о разработке поисковой системы.


window-new
Soft
Hard
Тренды 🔥
ChatGPT показал сильнейший в истории скачок выручки у мобильного приложения после запуска GPT-4o 17 мин.
Подписка требует жертв: инсайдеры предупредили о подорожании Game Pass из-за Call of Duty 2 ч.
OpenAI отключила в ChatGPT голос Sky в из-за удивительного сходства с голосом Скарлетт Йоханссон 2 ч.
Google обвинила Microsoft в неспособности защитить клиентов от кибератак 2 ч.
Опубликованы первые тесты видеокарт в бенчмарке 3DMark Steel Nomad, который выйдет завтра 2 ч.
Гендиректор Take-Two: Rockstar постарается выпустить GTA VI без багов, но это не главное 5 ч.
«Обязателен для всех фанатов»: для ремастера культового квеста Grim Fandango вышел мод с улучшениями графики 6 ч.
С конца мая ЦБ начнет проверять, как в банках идёт импортозамещение ПО 6 ч.
«Встряхнёт игровую индустрию»: новый геймплейный трейлер Black Myth: Wukong привёл геймеров в восторг 7 ч.
Apple и OpenAI объявят о сотрудничестве на конференции WWDC в июне 9 ч.
Asus выпустила первый в мире WOLED-монитор с глянцевым экраном без бликов — 26,5-дюймовый ROG Strix OLED XG27AQDMG 13 мин.
HMD Global готовит смартфон с дизайном легендарного Nokia Lumia 920 20 мин.
В погоне за ИИ: большинство строящихся в Северной Америке ЦОД арендуют ещё до того, как они готовы, несмотря на рост цен 60 мин.
Глава Asus: эволюция ИИ ПК пойдёт сложным путём 2 ч.
На память HBM к концу года придётся 35 % производства DRAM по передовым техпроцессам 3 ч.
Vivo выпустила смартфон iQoo Neo9S Pro на чипе Dimensity 9300+ по цене прошлогоднего Neo9 Pro с Dimensity 9300 5 ч.
Аналитики ожидают от Nvidia рекордный квартальный отчёт 5 ч.
«Яндекс» намерен запустить серийное производство роботов-курьеров до конца 2024 года 5 ч.
Google Cloud умудрилась поломать собственную сетевую инфраструктуру, но быстро исправилась 6 ч.
Apple повысила скидки на iPhone в Китае, а в США стала дороже выкупать б/у смартфоны 6 ч.