Сегодня 09 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → chatgpt
Быстрый переход

OpenAI создаст собственную социальную сеть в стиле X

Компания OpenAI может выйти на рынок социальных сетей. Разработчики ChatGPT работают над проектом, который, возможно, в чём-то будет напоминать соцсеть X. Основной целью называется возможность обучения ИИ на уникальных данных — как это уже делают платформы Meta и X.

 Источник изображения: Rolf van Root / Unsplash

Источник изображения: Rolf van Root / Unsplash

Проект пока находится на ранней стадии, но, как сообщает The Verge, внутри компании уже создан прототип с лентой, в которую пользователи могут выкладывать изображения, сгенерированные ChatGPT. Генеральный директор OpenAI Сэм Альтман (Sam Altman) призвал сторонних экспертов обсудить идею, однако пока не ясно, будет ли приложение самостоятельным или станет частью ChatGPT.

Запуск социальной сети может усилить противостояние между Альтманом и Илоном Маском (Elon Musk). Напомним, в феврале Маск предложил выкупить OpenAI за $97,4 млрд, на что Альтман ответил: «Нет, спасибо, но мы, в свою очередь, могли бы купить Twitter за $9,74 млрд».

Одновременно OpenAI, как считают аналитики, рискует вступить в прямую конкуренцию с Meta, которая, по слухам, разрабатывает отдельное приложение с ИИ-ассистентом и социальной лентой. При этом ранее, когда появились первые сообщения о приложении Meta, Альтман опубликовал пост в X о том, что не исключает создания собственной социальной сети.

Наличие собственной соцсети позволило бы OpenAI собирать уникальные данные в реальном режиме времени — точно так же, как это уже делают X и Meta, обучая свои модели искусственного интеллекта (ИИ) на открытом пользовательском контенте на своих платформах. Остаётся неясным, выйдет ли проект OpenAI за пределы лаборатории компании.

Каждый десятый человек на Земле теперь пользуется ChatGPT, и его популярность только растёт

Число еженедельных активных пользователей ChatGPT приблизилось к одному миллиарду. Такой рост совпал с мартовским обновлением функции генерации изображений, что вызвало всплеск интереса к ИИ-сервису. В прошлом месяце ChatGPT стал самым загружаемым в мире приложением за исключением игр, а общее количество его установок составило 46 млн.

 Источник изображения: Growtika / Unsplash

Источник изображения: Growtika / Unsplash

Во время беседы на сцене конференции TED куратор мероприятия Крис Андерсон (Chris Anderson) задал Сэму Альтману (Sam Altman), генеральному директору OpenAI, вопрос о числе пользователей ChatGPT. Альтман ответил, что последняя озвученная цифра составляла 500 млн еженедельных активных пользователей, и добавил, что аудитория продолжает стремительно расти. Андерсон заметил, что в частной беседе Альтман упоминал о двукратном росте за несколько недель. Альтман это не опроверг.

Альтман также сообщил, что ChatGPT пользуются около 10 % населения Земли. Поскольку сегодня на Земле живут более 8 млрд человек, это примерно 800 млн пользователей. После запуска 30 ноября 2022 года бесплатной исследовательской версии ChatGPT на основе ИИ-модели GPT-3.5, он достиг отметки в 100 млн пользователей всего за два месяца, став самым популярным приложением в истории. Для сравнения: TikTok для этого потребовалось девять месяцев, а Instagram — два с половиной года.

К августу 2024 года число еженедельных активных пользователей ChatGPT достигло 200 млн. Последующий резкий рост был вызван обновлением 25 марта, в котором были улучшены возможности генерации изображений. После этого социальные сети наводнили изображения и видео, выполненные в различных художественных стилях, наиболее популярным из которых оказался стиль японской анимационной студии Studio Ghibli. Альтман отметил, что спрос оказался настолько высоким, что фактически «плавил» графические процессоры компании. Хорошей новостью для OpenAI стало то, что обновление привлекло миллион новых пользователей ChatGPT всего за один час.

Согласно данным аналитической платформы Appfigures, в марте ChatGPT стал самым скачиваемым неигровым приложением в мире. Количество установок выросло на 28 % по сравнению с февралем и достигло 46 млн. Взрывному успеху способствовало не только улучшение генератора изображений, но и, вероятно, снятие некоторых ограничений в работе сервиса.

 Источник изображения: TED

Источник изображения: TED

На фоне популяризации генеративного ИИ усиливаются опасения по поводу его влияния на рынок труда. Всё больше компаний сокращают персонал, поскольку задачи, ранее выполнявшиеся людьми, теперь выполняют ИИ-системы. На вопрос о том, заменит ли ИИ человека, Альтман ответил: «Можно сказать: „О, Боже, оно делает всё, что делаю я. Что же со мной будет?“ Или вы можете сказать, как во времена всех других технологических революций в истории: „Хорошо, теперь есть новый инструмент. Я могу делать гораздо больше. Что я смогу делать?“ Конечно, ожидания от человека, занимающего определённую должность, возрастают, но возможности расширяются настолько значительно, что, я думаю, соответствовать этим ожиданиям возможно».

Мошенники наводнили десятки тысяч сайтов спамом с помощью OpenAI GPT-4o-mini

Спам-бот AkiraBot использовал ИИ-модель GPT-4o-mini через API OpenAI для создания спам-комментариев, продвигающих фиктивные SEO-услуги. Разнообразие содержания этих комментариев позволяло обходить системы фильтрации на тысячах сайтов по всему миру, говорится в исследовании компании SentinelOne.

 Источник изображения: Wesley Tingey / Unsplash

Источник изображения: Wesley Tingey / Unsplash

Согласно отчёту компании SentinelOne, специализирующейся на кибербезопасности, AkiraBot атаковал не менее 80 000 веб-сайтов, большинство из которых принадлежат малому и среднему бизнесу, использующему платформы электронной торговли, такие как Shopify, GoDaddy, Wix и Squarespace.

Как сообщает издание 404 Media, бот направлял в API OpenAI запрос: «Вы — полезный помощник, который создаёт маркетинговые сообщения», — после чего ИИ генерировал спам-комментарии, адаптированные под тематику конкретных сайтов. Так, для сайта строительной компании создавался один вариант спам-сообщений, а для салона красоты — другой. Затем эти комментарии размещались в чатах и формах обратной связи на сайтах, с целью побудить их владельцев приобрести SEO-услуги. Поздние версии спам-бота начали использовать для этих целей также онлайновые чат-виджеты, встроенные в большинство современных сайтов.

«Поиск сайтов, ссылающихся на домены AkiraBot, показывает, что ранее этот бот размещал сообщения таким образом, что они индексировались поисковыми системами», — говорится в сообщении SentinelOne. Упомянутый спам-бот появился в сентябре 2024 года и не имеет отношения к группе Akira, занимающейся распространением вымогательского программного обеспечения.

Помимо GPT-4o-mini, AkiraBot использовал прокси-сервисы для обхода CAPTCHA и маскировки сетевой активности. OpenAI заблокировала соответствующий API-ключ и заявила, что продолжает расследование, пообещав отключить все активы, связанные с инцидентом. «Мы серьёзно относимся к злоупотреблениям и постоянно совершенствуем наши системы для их выявления», — говорится в заявлении OpenAI.

Случаи неправомерного использования инструментов OpenAI уже отмечались ранее — в том числе при создании пропагандистских материалов государственными структурами. Однако зачастую киберпреступники предпочитают использовать собственные ИИ-системы. Так, в 2023 году была выявлена ИИ-модель WormGPT, позволявшая мошенникам вести переписку от имени банка и автоматизировать процесс обмана пользователей.

ChatGPT обошёл Instagram✴ и TikTok, став самым скачиваемым приложением в мире

Приложение ChatGPT впервые возглавило мировой рейтинг загрузок в марте 2025 года, обогнав таких гигантов, как Instagram и TikTok. По данным аналитической компании Appfigures, число установок ChatGPT выросло на 28 % по сравнению с февралём и составило около 46 миллионов загрузок за месяц. С момента запуска приложения, март оказался для OpenAI лучшим месяцем.

 Источник изображения: Rolf van Root / Unsplash

Источник изображения: Rolf van Root / Unsplash

Instagram, удерживавший лидерство в январе и феврале, опустился на второе место, а TikTok занял третью строчку в App Store и Google Play, сообщает TechCrunch. При этом, рост популярности ChatGPT связывают с важными обновлениями. В частности, впервые за более чем год были улучшены функции генерации изображений, что позволило пользователям создавать вирусные картинки и мемы в стиле анимационной студии Studio Ghibli, которые быстро разошлись по социальным сетям в конце марта и начале апреля.

Кроме того, OpenAI ослабила ограничения в политике модерации визуального контента и обновила в приложении голосовой режим. Тем не менее, аналитики считают, что не только новые функции повлияли на скачок популярности.

«Складывается впечатление, что слово ChatGPT становится глаголом, таким же, каким стал Google в 2000-х. Многие уже говорят не искусственный интеллект, а просто ChatGPT», — отметил основатель и генеральный директор Appfigures Ариэль Михаэли (Ariel Michaeli). По его словам, волну интереса к ИИ также подогревают конкуренты вроде Grok или DeepSeek, но пользователи всё равно скачивают ChatGPT.

К сожалению, популярность ChatGPT также затрудняет рост других чат-ботов. К примеру, Claude от Anthropic пока не может приблизиться к таким же результатам. У Grok, наоборот, шансы несколько выше, но во многом благодаря фигуре самого Илона Маска (Elon Musk) и его платформе X, которая активно продвигает продукт.

 Источник изображения: Appfigures

Источник изображения: Appfigures

В общемировом рейтинге в марте также оказались Facebook, WhatsApp, Telegram, Snapchat и Threads. Всего 10 самых популярных приложений были загружены 339 миллионов раз, что на 40 миллионов больше, чем в феврале.

OpenAI готовится запустить ИИ-модель GPT-4.1, но возможны задержки

Компания OpenAI планирует в ближайшее время представить несколько новых моделей искусственного интеллекта, включая обновлённую версию GPT-4 под названием GPT-4.1, которая станет усовершенствованной версией флагманской рассуждающей модели GPT-4o.

 Источник изображения: AI

Источник изображения: AI

По данным The Verge, улучшенная новая модель GPT-4.1 также, как и GPT-4o сможет обрабатывать текст, изображение и аудио в режиме реального времени. Вместе с ней OpenAI планирует выпустить и более лёгкие версии — GPT-4.1 mini и nano, запуск которых может состояться уже на следующей неделе.

Кроме того, компания готовит к релизу полную версию модели o3, а также облегчённый вариант o4 mini. ИИ-разработчик Тибор Блахо (Tibor Blaho), известный тем, что раньше других замечает возможные нововведения, обнаружил упоминания этих моделей в новой веб-версии ChatGPT, что, по его мнению, указывает на их скорый запуск.

Интересно, что генеральный директор OpenAI Сэм Альтман (Sam Altman) ранее намекал в соцсети X на «захватывающие функции», которые появятся в линейке продуктов компании, однако не уточнил, связано ли это с новыми моделями. При этом он также предупреждал, что пользователи могут столкнуться с задержками и сбоями из-за высокой нагрузки на вычислительные мощности: «Следует ожидать задержек, сбоев и медленной работы сервисов, пока мы решаем проблемы с производительностью».

Напомним, ранее OpenAI уже была вынуждена ограничить использование генератора изображений в бесплатной версии ChatGPT из-за перегрузки серверов, так как, по словам Альтмана, популярность этой функции привела к тому, что их GPU чуть ли не стали плавиться, подтверждая предположение о колоссальном спросе на услуги компании.

OpenAI прокачала память ChatGPT, чтобы бот мог ссылаться на прошлые диалоги

Компания OpenAI сообщила о развёртывании новой функции в ChatGPT, которая наделит ИИ-чат-бота более продвинутой памятью. Новая функция позволит боту подгонять свои ответы под пользователей на основе содержания всех предыдущих разговоров.

 Источник изображения: Rolf van Root / Unsplash

Источник изображения: Rolf van Root / Unsplash

Компания уточняет, что новая функция, отображающаяся в настройках ChatGPT как «Сохранённые воспоминания», направлена на то, чтобы сделать разговоры с ChatGPT более релевантными для пользователей. Обновление добавит разговорный контекст к текстовым и голосовым ответам, а также к генерации изображений чат-бота.

Новая функция памяти будет развёрнута сначала для платных подписчиков ChatGPT Pro и Plus, за исключением пользователей из Великобритании, ЕС, Исландии, Лихтенштейна, Норвегии и Швейцарии. OpenAI поясняет, что для запуска данной функции в этих регионах требуется дополнительная внешняя проверка на соответствие местному законодательству. Для бесплатных пользователей новая функция памяти недоступна. «Сейчас мы сосредоточены на её развёртывании на платных уровнях», — прокомментировал представитель OpenAI в разговоре с TechCrunch.

Цель новой функции памяти — сделать ChatGPT более гибким и персональным. Пользователям не придется повторять информацию, которой они уже поделились с ChatGPT в рамках предыдущих разговоров. В феврале этого года Google запустила похожую функцию памяти в Gemini.

Конечно, далеко не все пользователи будут в восторге от идеи, что OpenAI сможет таким образом «выкачивать» из них больше информации, пишет TechCrunch. К счастью, у них есть возможность отказаться от использования этой функции. В настройках ChatGPT можно отключить новую функцию памяти, а также управлять отдельными сохранёнными воспоминаниями.

В прошлом году OpenAI обновила ChatGPT, чтобы по запросу пользователя чат-бот мог забывать или помнить определённые детали предыдущих разговоров. Однако эта функция, как правило, требовала явного запроса от пользователя для обновления памяти ChatGPT. Сегодняшний запуск делает процесс более органичным. OpenAI сообщает, что новая функция памяти будет включена по умолчанию для пользователей, у которых ранее были активированы возможности памяти ChatGPT.

Картинки в стиле Ghibli перегрузили серверы OpenAI — выпуск новых функций замедлен

Генеральный директор OpenAI Сэм Альтман (Sam Altman) заявил, что из-за высокой популярности нового инструмента генерации изображений в ChatGPT компания столкнулась с перегрузкой оборудования, из-за чего выход новых продуктов и функций придётся ограничить.

 Источник изображения: Mariia Shalabaieva / Unsplash

Источник изображения: Mariia Shalabaieva / Unsplash

По словам Альтмана, OpenAI пытается справиться с ситуацией, но пользователям следует ожидать как минимум задержек в релизах, а также перебоев в работе сервисов и замедления работы платформы. Тем не менее, как отмечает TechCrunch, компания уверяет, что держит ситуацию под контролем. «Что-то будет ломаться, а обслуживание иногда будет медленным, поскольку мы справляемся с проблемами, связанными с пропускной способностью, — написал Альтман. — Мы стараемся решать проблемы оперативно, чтобы всё действительно работало».

Напомним, выпущенный недавно новый генератор изображений вызвал буквально ажиотаж благодаря способности имитировать различные стили, в частности популярный стиль анимационной студии Studio Ghibli. Однако компания не успевает справляться с наплывом пользователей, а сотрудники вынуждены работать допоздна и даже в выходные, чтобы поддерживать работоспособность системы.

Чтобы снизить нагрузку на свои серверы, OpenAI задержала запуск нового инструмента генерации изображений для бесплатных пользователей ChatGPT, а возможность создания видео с помощью Sora временно отключена для новых пользователей. Компания не уточняет, когда проблемы с перегрузкой будут окончательно решены и пока продолжает работать над улучшением инфраструктуры.

В понедельник ChatGPT зафиксировал регистрацию в сервисе одного миллиона новых пользователей всего за один час. Также отметим, что на сегодня системой пользуются 500 миллионов еженедельных пользователей и 20 миллионов подписчиков, что значительно больше по сравнению с концом 2024 года, когда показатели составляли 300 миллионов и 15,5 миллиона соответственно.

ChatGPT остаётся самым популярным чат-ботом с ИИ, но у конкурентов аудитория тоже растёт

Чат-бот с искусственным интеллектом OpenAI ChatGPT остаётся самым популярным сервисом этого типа в мире. Но активно наращивают аудиторию и конкурирующие платформы, гласит статистика аналитических компаний SimilarWeb и Sensor Tower.

 Источник изображения: Levart_Photographer / unsplash.com

Источник изображения: Levart_Photographer / unsplash.com

SimilarWeb специализируется на оценке трафика веб-сайтов, включая веб-версии чат-ботов, и, как утверждают в компании, по итогам марта сервис Google Gemini нарастил аудиторию на 7,4 % в сравнении с февралём — показатель достиг 10,9 млн посетителей в день; Microsoft Copilot за месяц нарастил аудиторию на 2,1 млн до 2,4 млн; Anthropic Claude достиг в марте посещаемости в 3,3 млн человек; чат-бот китайской DeepSeek преодолел отметку 16,5 млн пользователей в день — такой же результат показал xAI Grok. У ChatGPT по состоянию на конец марта были 500 млн посетителей в день.

Платформа OpenAI остаётся впереди с колоссальным отрывом, но за второе место развернулась нешуточная битва. Занявший по итогам марта второе место DeepSeek растерял 25 % февральской аудитории, xAI Grok по сравнению с предшествующим месяцем показал рост почти на 800 %, и это крупнейшая положительная динамика в рейтинге, говорят в SimilarWeb.

Динамика посещаемости мобильных приложений чат-ботов связывается с выпуском новых моделей ИИ. В течение недели, начавшейся 24 февраля, когда Anthropic выпустила Claude 3.7 Sonnet, аудитория приложения Claude выросла на 21 %, гласит статистика Sensor Tower. Двумя неделями ранее, вскоре после выхода Google Gemini 2.0 Flash аудитория приложения Gemini показала недельный рост на 42 %. Помимо выхода обновлённых моделей, пользователей интересуют и новые возможности сервисов: функция Canvas в Gemini, которая позволяет запускать программный код; или новые функции Claude, которые Anthropic добавляет постоянно.

Но и здесь поводов для паники у OpenAI пока не отмечается. По состоянию на март число активных пользователей мобильного приложения ChatGPT десятикратно превзошло аудиторию Gemini и Claude вместе взятых.

В RuStore появилась оплата ChatGPT и других ИИ-сервисов рублями, но с большой наценкой

В российском магазине мобильных приложений RuStore появилась новая услуга — возможность оплачивать премиум-подписку на зарубежные службы искусственного интеллекта, обратил внимание «Код Дурова». Функция доступна в разделе «Киоск».

 Источник изображений: kod.ru

Источник изображений: kod.ru

Чтобы оплатить подписку ChatGPT, нужно зайти на сайт RuStore, открыть раздел «Киоск» и выбрать интересующий сервис. Месячная подписка по тарифу ChatGPT Plus стоит 2875 руб., вариант ChatGPT Pro обойдётся в 26 396 руб. Для сравнения, сама платформа взимает за них $20 и $200 соответственно — по актуальному курсу это примерно 1700 и 17 000 руб.

 Источник изображений: kod.ru

Здесь же можно оплатить другие ИИ-сервисы, в том числе генератор изображений Midjourney, службы создания музыки Udio и Suno AI, генератор текстов Mistral AI, сервис Krea.AI и другие услуги. Также есть возможность оплатить подписку Netflix для разных регионов. Оплата производится через «Систему быстрых платежей» (СБП) в рублях; цены указаны с учётом комиссий.

Ранее в разделе «Киоск» магазина RuStore появилась возможность пополнять баланс Steam, Roblox и других сервисов. Сейчас к ним добавились PlayStation для разных регионов, Xbox, Twitch и другие платформы, которые не принимают прямую оплату от российских пользователей.

«Наши GPU плавятся»: ажиотаж вокруг нового генератора картинок в ChatGPT заставил OpenAI ввести ограничения

Представленная на днях функция 4o Image Generation генерации качественных изображений вызвала огромный интерес у пользователей. Ажиотаж даже вынудил OpenAI «временно» ограничить частоту отправки запросов на генерацию изображений, сообщил в соцсети X гендиректор компании Сэм Альтман (Sam Altman). «Очень забавно наблюдать, как людям нравятся изображения в ChatGPT, но наши графические процессоры плавятся», — отметил он в своём сообщении.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Альтман не уточнил, какой предел скорости был установлен, лишь выразив надежду, что это ограничение не понадобится надолго, поскольку OpenAI пытается повысить эффективность обработки огромного числа запросов.

Высочайший спрос уже заставил компанию отсрочить запуск обновлённого генератора изображений на базе GPT-4o для бесплатных пользователей ChatGPT — Альтман ранее пообещал, что бесплатные пользователи «скоро» смогут генерировать с его помощью до трёх изображений в день. Но, по-видимому, этого оказалось недостаточно, чтобы как-то снизить нагрузку на инфраструктуру OpenAI.

Улучшенный инструмент генерации изображений использует мультимодальную большую языковую модель GPT-4o. Получающиеся с его помощью изображения выглядят качественно, более реалистично и лучше соответствуют запросам. Также имеются успехи в преодолении прошлых проблем, например, с отображением текста. В интервью ресурсу The Verge представитель компании назвал улучшение генерации как «шаговое изменение» по сравнению с предыдущими моделями. Тем не менее возникшие проблемы служат напоминанием о том, сколько технической мощности и энергии требуется для реализации функции генерации изображений в ChatGPT, отметил The Verge.

Microsoft вынашивает идею разработки собственного мощного ИИ

Выступающая в роли крупнейшего инвестора OpenAI корпорация Microsoft до сих пор предпочитала полагаться на возможности больших языковых моделей первой и её же чат-бота ChatGPT, но в дальнейшем не исключена возможность создания собственных производительных систем искусственного интеллекта, как дал понять генеральный директор Сатья Наделла (Satya Nadella).

 Источник изображения: Microsoft

Источник изображения: Microsoft

Соответствующие заявления он сделал в интервью группе японских журналистов во время своего визита в Токио, как сообщает Nikkei. По мнению главы Microsoft, создание собственной платформы для искусственного интеллекта позволит оптимизировать работу с программным обеспечением корпорации для корпоративных клиентов. «Мы построим свои собственные возможности для дополнения всего того, что мы делаем с OpenAI», — заявил Наделла. Внедрять собственный ИИ в приложения и сервисы для корпоративного сегмента Microsoft будет в том случае, если поймёт, что он будет полезен для потребителей.

Microsoft не только адаптирует решения OpenAI к своей программной инфраструктуре. Компания расширит команду разработчиков приложений для искусственного интеллекта, и ожидается, что со временем её собственные разработки в этой сфере не будут уступать передовым решениям OpenAI. «Мы все будем подчиняться реальному спросу. То, куда пойдёт ИИ, будет зависеть исключительно от происходящего с мировым ростом ВВП», — пояснил глава Microsoft стратегию инвестиций в сферу искусственного интеллекта.

В прошлом году Microsoft открыла в Японии первый исследовательский центр, связанный с разработкой ИИ для робототехники и автомобилей. Корпорация полна готовности глубоко сотрудничать с японскими компаниями и разработчиками, использующими открытый исходный код. Наделла считает, что использование единых стандартов в сфере безопасности ИИ пойдёт на пользу всем и сократит возможные издержки, связанные с рисками.

OpenAI рассчитывает более чем утроить выручку в этом году, а затем удвоить её в следующем

Занимающая лидирующие позиции на рынке систем генеративного искусственного интеллекта компания OpenAI номинально остаётся стартапом, её финансовая отчётность официально не публикуется, поэтому приходится получать данные из неофициальных источников. Они гласят, что в текущем году выручка OpenAI вырастет более чем в три раза.

 Источник изображения: OpenAI

Источник изображения: OpenAI

В прошлом году, по имеющимся у Bloomberg данным, выручка компании не превысила $3,7 млрд, но в этом прогнозируется её рост до $12,7 млрд. В следующем году темпы роста замедлятся, но выручка всё равно увеличится более чем в два раза до $29,4 млрд. По данным на сентябрь прошлого года, OpenAI на тот момент рассчитывала выручить в 2025 году только $11,6 млрд.

OpenAI несёт огромные расходы на развитие вычислительной инфраструктуры и расширение штата сотрудников, поэтому на окупаемость она рассчитывает выйти не ранее 2029 года, когда её выручка достигнет $125 млрд. Значительную часть дохода компания получает от подписчиков ChatGPT. Корпоративной версией чат-бота по состоянию на сентябрь прошлого года пользовался миллион человек. Сейчас для доступа к самым продвинутым языковым моделям OpenAI пользователи должны отдавать по $200 в месяц. Кроме того, руководством компании обсуждается возможность введения тарифного плана, подразумевающего абонентскую плату в размере нескольких тысяч долларов в месяц. Капитализация OpenAI оценивается в $300 млрд, но чтобы привлечь больше инвесторов, она должна изменить организационную структуру, поскольку сейчас ею командует некоммерческая организация.

OpenAI решила попридержать запуск 4o Image Generation для бесплатных пользователей

Компания OpenAI вынуждена перенести сроки предоставления доступа к встроенному генератору изображений в ChatGPT для пользователей бесплатной версии. Сэм Альтман (Sam Altman) в своём сообщении признал, что новый инструмент 4o Image Generation оказался популярнее, чем ожидалось, поэтому развёртывание для бесплатного использования будет отложено на некоторое время, сообщает The Verge.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Новый ИИ-генератор изображений был интегрирован в ChatGPT буквально на днях. С его помощью можно создавать картинки непосредственно в приложении, используя новейшую модель рассуждений GPT-4o. Функция так понравилась пользователям, что они уже вовсю стали делиться в социальных сетях изображениями, в частности, стилизованными под работы студии Ghibli, — тренд, к которому присоединился даже сам Альтман.

По словам разработчиков, 4o Image Generation отличается улучшенным рендерингом текста и использует для генерации изображений так называемый авторегрессионный подход, когда изображение создаётся последовательно, слева направо и сверху вниз, а не одномоментно целиком, что позволяет создавать картинки без каких-либо ошибок или искажений в тексте, чего раньше добиться в других генераторах не удавалось.

В настоящее время доступ к функции имеют только подписчики платных тарифов ChatGPT Plus, Pro и Team. Когда именно пользователи бесплатной версии смогут опробовать новый ИИ-генератор, пока не совсем ясно из-за неожиданно высокого спроса на эту функцию.

OpenAI представила функцию генерации точных изображений в ChatGPT на базе GPT-4o — она доступна бесплатно

OpenAI встроила функцию генерации точных изображений непоcредственно в ChatGPT. Новая функция, именуемая 4o Image Generation, опирается на мультимодальную большую языковую модель GPT-4o. Она понимает контекст, сложные инструкции, взаимодействия объектов и даже генерирует текстовые надписи без артефактов. Доступ для всех откроют сегодня.

 Источник изображения: OpenAI

Источник изображений: OpenAI

ChatGPT и прежде умел генерировать изображения с помощью нейросети Dall-E 3. Однако обновлённая функция работает куда лучше и точнее. Представитель OpenAI Тайя Кристиансон (Taya Christianson) уточнила, что лимиты для бесплатных пользователей останутся такими же, как у DALL-E, то есть три изображения в день. Доступ к DALL-E по-прежнему возможен через пользовательский интерфейс ChatGPT.

Как отметил глава исследований Габриэль Го (Gabriel Goh), использование GPT-4o позволяет ИИ работать с любыми типами данных — текстом, изображениями, аудио и видео. Кроме того, Sora получила ключевое улучшение, заключающееся в корректном соотношении атрибутов и объектов (binding). Го объяснил, что большинство ИИ путаются при обработке 5–8 элементов. Например, ИИ может получить запрос нарисовать синюю звезду и красный треугольник, но создать красную звезду и нечто отличное от треугольника. 4o Image Generation справляется с 15–20 объектами без ошибок.

 Источник изображения: OpenAI

Пользователи также заметят улучшение в отрисовке текста, что позволяет генерировать на изображениях читаемый текст без опечаток. В существующих инструментах для генерации изображений текст часто искажался и достижение качественного рендеринга в этом смысле было серьёзной проблемой, так как даже небольшие ошибки в заголовках или текстовых элементах могут сделать всё изображение полностью непригодным.

 Генерация по запросу «сделайте очень красочную ризографию о том, как приготовить матча» (make a very colorful risograph on how to make matcha)

Генерация по запросу «Cделай очень красочную ризографию о том, как приготовить матча» (make a very colorful risograph on how to make matcha)

Система также использует теперь нестандартный метод генерации. Изображения создаются последовательно, слева направо и сверху вниз, а не целиком, как это происходит в DALL-E. По мнению Го, это объясняет превосходство 4o Image Generation в работе с текстом и сложными сценами.

OpenAI продемонстрировала возможности 4o Image Generation на научных диаграммах, например, эксперимент Ньютона с призмой, комиксах и постерах. Также были показаны практические применения в создании изображений с прозрачным фоном для стикеров, меню ресторанов и логотипов. 4o Image Generation со всеми заданиями справилась успешно, не допустив в тексте никаких ошибок.

Также 4o Image Generation способен редактировать загруженные пользователем изображения по простым запросам, добавляя на них элементы или наоборот убирая.

 Пример добавление элементов на фотографию с помощью GPT-4o

Пример добавление элементов на фотографию с помощью GPT-4o

Однако новая система генерирует изображения дольше, чем предыдущие, но OpenAI считает это оправданным компромиссом. «Хотя у нас определённо есть возможности для улучшения времени отклика, качество этих изображений, возможности, знание о мире действительно компенсируют дополнительные секунды ожидания», — сказали в компании.

 Источник изображения: OpenAI

Отвечая на вопросы о мерах безопасности, упоминая скандальные дипфейки Тейлор Свифт (Taylor Swift), созданные с помощью модели Microsoft, способность Grok от xAI изобразить Камалу Харрис (Kamala Harris) с оружием и удаление водяных знаков в Google Gemini, команда OpenAI подчеркнула наличие надёжных механизмов защиты от злоупотреблений.

Директор по дизайну OpenAI Шеннон Джагер (Jackie Shannon) заявила, что инструмент предотвращает удаление водяных знаков, блокирует генерацию дипфейков, связанных с телом человека и отказывает в запросах на создание материалов с различным родом насилия над детьми (CSAM). Кроме того, Шеннон пояснила, что все сгенерированные изображения будут включать стандартные метаданные C2PA, чтобы отметить изображение как созданное OpenAI.

Голосовая версия ChatGPT стала приятнее в общении, сообщили в OpenAI

OpenAI накануне обновила функцию Advanced Voice Mode — формат голосового общения с ChatGPT в реальном времени. Помощник с искусственным интеллектом стал приятнее в общении и научился реже прерывать пользователей.

 Источник изображения: openai.com

Источник изображения: openai.com

С последним обновлением OpenAI попыталась решить проблему, характерную для многих голосовых помощников с ИИ — они часто прерывают пользователей, если те приостанавливают речь, чтобы подумать или сделать глубокий вдох. Обновлённая версия Advanced Voice Mode стала доступной для пользователей бесплатного варианта ChatGPT, которая теперь позволяет делать продолжительные паузы в речи и не прерывает собеседника. Подписчики платных вариантов сервиса, в том числе тарифов ChatGPT Plus, Teams, Edu, Business и Pro получили не только более деликатного, но и более индивидуализированного голосового помощника — его ответы стали «более прямыми, интересными лаконичными, конкретными и творческими», рассказали в OpenAI.

OpenAI зарекомендовала себя как мирового лидера в области искусственного интеллекта, но ей приходится прилагать всё более значительные усилия, чтобы оставаться впереди конкурентов. В сегменте голосовых помощников в последнее время вирусную популярность приобрёл стартап Sesame соучредителя Oculus Брендана Ирибе (Brendan Iribe) — он выпустил варианты сервиса Maya и Miles, которые отличаются естественным звучанием. Голосовых помощников с мощным ИИ выпускают и крупные игроки: Amazon недавно представила Alexa+ с генеративным ИИ, а Apple была вынуждена перенести выпуск поумневшей Siri, что обернулось нешуточным скандалом.


window-new
Soft
Hard
Тренды 🔥
Сэм Альтман передал управление ChatGPT новому руководителю, а сам займётся исследованиями 59 мин.
Google защитит пользователей Chrome от фишинга с помощью локальной ИИ-модели Gemini Nano 2 ч.
Microsoft упростит установку приложений в Windows 11, но это может привести к засорению системы 10 ч.
Первое сюжетное дополнение к Kingdom Come: Deliverance 2 не заставит себя долго ждать — новый трейлер и дата выхода Brushes with Death 11 ч.
Meta наделит следующие умные очки Ray-Ban «супервосприятием» — функцией распознавания лиц окружающих 13 ч.
Первый геймплейный трейлер подтвердил дату выхода Mafia: The Old Country — игру будут продавать за $50 13 ч.
ИИ-боты начинают чаще привирать, когда их просят о лаконичных ответах — исследование 14 ч.
Перенос GTA VI прибавил Electronic Arts уверенности в успехе новой Battlefield 14 ч.
Apple начала принимать заявки на компенсации по иску о подслушивании Siri 15 ч.
Saber Interactive «выкатила» системные требования амбициозного симулятора RoadCraft 17 ч.