Опрос
|
реклама
Быстрый переход
Сэм Альтман: GPT-5 задержится, чтобы стать лучше — зато «думающий» ИИ OpenAI o3 выйдет совсем скоро
04.04.2025 [18:34],
Сергей Сурабекянц
OpenAI планировала широкомасштабный запуск своей модели рассуждений o3 в феврале, но затем отложила его на неопределённое время. Теперь компания твёрдо уверена, что o3 и модель следующего поколения o4-mini будут представлены публике в течение «пары недель». Об этом сообщил в соцсети X генеральный директор OpenAI Сэм Альтман (Sam Altman). Он также рассказал, почему GPT-5 станет доступна лишь «через несколько месяцев». ![]() Источник изображения: unsplash.com По словам Альтмана, такая смена курса связана с намерением компании «сделать GPT-5 намного лучше, чем мы изначально думали». GPT-5 должна стать унифицированной моделью, включающей так называемые возможности рассуждений. «Мы также обнаружили, что плавно интегрировать все оказалось сложнее, чем мы думали. И мы хотим убедиться, что у нас достаточно мощностей для поддержки того, что, как мы ожидаем, станет пользоваться беспрецедентным спросом», — пояснил Альтман. Сразу после выпуска модели, OpenAI планирует предложить неограниченный доступ к ней на «стандартных настройках интеллекта» с учётом «порогов злоупотребления». По словам Альтмана, подписчики ChatGPT Plus смогут работать с GPT-5 на «более высоком уровне интеллекта», а обладатели подписки ChatGPT Pro смогут запускать GPT-5 на «ещё более высоком уровне интеллекта». «GPT-5 будет включать голос, холст, поиск, глубокие исследования и многое другое, — заявил Альтман в начале этого года. —Главная цель для нас — объединить [наши] модели, создав системы, которые могут использовать все наши инструменты, знать, когда думать долго, а когда нет, и в целом быть полезными для очень широкого спектра задач». Мощнейшая ИИ-модель OpenAI o3 тратит до $30 000 на решение одной задачи
03.04.2025 [13:07],
Павел Котов
В декабре OpenAI представила рассуждающую модель искусственного интеллекта o3 и продемонстрировала результаты бенчмарка ARC-AGI — самого сложного теста для оценки возможностей ИИ. Теперь результаты теста пришлось пересмотреть, и выглядят они менее впечатляющими: модель оказалась слишком дорогой в обслуживании. ![]() Источник изображения: Mariia Shalabaieva / unsplash.com На минувшей неделе организация Arc Prize Foundation, ответственная за ARC-AGI, обновила свою оценку затрат на вычисления для OpenAI o3. Первоначально считалось, что её наиболее мощная конфигурация o3 high требует расходов в размере около $3000 на решение одной задачи ARC-AGI. Теперь же было установлено, что стоимость обслуживания намного выше — она, возможно, достигает $30 000 за задачу. Это иллюстрирует, насколько дорогими могут оказаться самые сложные современные модели ИИ в определённых задачах, по крайней мере, на начальном этапе. Цену на o3 компания OpenAI ещё не установила, и в общий доступ модель не поступила, но в Arc Prize Foundation предположили, что можно ориентироваться на показатели OpenAI o1-pro. «Считаем, что o1-pro является более близким сравнением [для определения] истинной стоимости o3 <..> из-за объёма используемых во время тестирования вычислений. Но это не точная оценка, и мы оставили для o3 пометку о предварительной версии в нашей таблице лидеров, чтобы отразить неопределённость, пока не объявлена официальная цена», — рассказали в Arc Prize Foundation ресурсу TechCrunch. Известно, что при решении одной задачи o3 high использовала в 172 раза больше вычислительных ресурсов в ARC-AGI, чем o3 low — наиболее слабая модель в линейке. Ранее стало известно, что тарифные планы на передовые системы OpenAI могут оказаться чрезвычайно дорогостоящими — до $20 000 в месяц за работу специализированных агентов ИИ. При этом моделям свойственно ошибаться: той же o3 high потребовалось 1024 попытки для решения каждой задачи теста ARC-AGI, чтобы показать лучший результат. Картинки в стиле Ghibli перегрузили серверы OpenAI — выпуск новых функций замедлен
02.04.2025 [00:41],
Анжелла Марина
Генеральный директор OpenAI Сэм Альтман (Sam Altman) заявил, что из-за высокой популярности нового инструмента генерации изображений в ChatGPT компания столкнулась с перегрузкой оборудования, из-за чего выход новых продуктов и функций придётся ограничить. ![]() Источник изображения: Mariia Shalabaieva / Unsplash По словам Альтмана, OpenAI пытается справиться с ситуацией, но пользователям следует ожидать как минимум задержек в релизах, а также перебоев в работе сервисов и замедления работы платформы. Тем не менее, как отмечает TechCrunch, компания уверяет, что держит ситуацию под контролем. «Что-то будет ломаться, а обслуживание иногда будет медленным, поскольку мы справляемся с проблемами, связанными с пропускной способностью, — написал Альтман. — Мы стараемся решать проблемы оперативно, чтобы всё действительно работало». Напомним, выпущенный недавно новый генератор изображений вызвал буквально ажиотаж благодаря способности имитировать различные стили, в частности популярный стиль анимационной студии Studio Ghibli. Однако компания не успевает справляться с наплывом пользователей, а сотрудники вынуждены работать допоздна и даже в выходные, чтобы поддерживать работоспособность системы. Чтобы снизить нагрузку на свои серверы, OpenAI задержала запуск нового инструмента генерации изображений для бесплатных пользователей ChatGPT, а возможность создания видео с помощью Sora временно отключена для новых пользователей. Компания не уточняет, когда проблемы с перегрузкой будут окончательно решены и пока продолжает работать над улучшением инфраструктуры. В понедельник ChatGPT зафиксировал регистрацию в сервисе одного миллиона новых пользователей всего за один час. Также отметим, что на сегодня системой пользуются 500 миллионов еженедельных пользователей и 20 миллионов подписчиков, что значительно больше по сравнению с концом 2024 года, когда показатели составляли 300 миллионов и 15,5 миллиона соответственно. ChatGPT остаётся самым популярным чат-ботом с ИИ, но у конкурентов аудитория тоже растёт
01.04.2025 [17:57],
Павел Котов
Чат-бот с искусственным интеллектом OpenAI ChatGPT остаётся самым популярным сервисом этого типа в мире. Но активно наращивают аудиторию и конкурирующие платформы, гласит статистика аналитических компаний SimilarWeb и Sensor Tower. ![]() Источник изображения: Levart_Photographer / unsplash.com SimilarWeb специализируется на оценке трафика веб-сайтов, включая веб-версии чат-ботов, и, как утверждают в компании, по итогам марта сервис Google Gemini нарастил аудиторию на 7,4 % в сравнении с февралём — показатель достиг 10,9 млн посетителей в день; Microsoft Copilot за месяц нарастил аудиторию на 2,1 млн до 2,4 млн; Anthropic Claude достиг в марте посещаемости в 3,3 млн человек; чат-бот китайской DeepSeek преодолел отметку 16,5 млн пользователей в день — такой же результат показал xAI Grok. У ChatGPT по состоянию на конец марта были 500 млн посетителей в день. Платформа OpenAI остаётся впереди с колоссальным отрывом, но за второе место развернулась нешуточная битва. Занявший по итогам марта второе место DeepSeek растерял 25 % февральской аудитории, xAI Grok по сравнению с предшествующим месяцем показал рост почти на 800 %, и это крупнейшая положительная динамика в рейтинге, говорят в SimilarWeb. Динамика посещаемости мобильных приложений чат-ботов связывается с выпуском новых моделей ИИ. В течение недели, начавшейся 24 февраля, когда Anthropic выпустила Claude 3.7 Sonnet, аудитория приложения Claude выросла на 21 %, гласит статистика Sensor Tower. Двумя неделями ранее, вскоре после выхода Google Gemini 2.0 Flash аудитория приложения Gemini показала недельный рост на 42 %. Помимо выхода обновлённых моделей, пользователей интересуют и новые возможности сервисов: функция Canvas в Gemini, которая позволяет запускать программный код; или новые функции Claude, которые Anthropic добавляет постоянно. Но и здесь поводов для паники у OpenAI пока не отмечается. По состоянию на март число активных пользователей мобильного приложения ChatGPT десятикратно превзошло аудиторию Gemini и Claude вместе взятых. OpenAI пообещала выпустить открытую рассуждающую ИИ-модель в ближайшие месяцы
01.04.2025 [16:34],
Павел Котов
«В ближайшие месяцы» OpenAI намерена выпустить открытую большую языковую модель искусственного интеллекта — она станет первой со времён GPT-2. Об этом говорится на специальной странице на сайте компании; здесь же размещена форма, которую предлагается заполнить «разработчикам, исследователям и всему сообществу». ![]() Источник изображения: Growtika / unsplash.com «Мы рады сотрудничеству с разработчиками, исследователями и сообществом, чтобы собрать мнения и сделать эту модель максимально полезной. Если вы заинтересованы дать обратную связь команде OpenAI, сообщите нам об этом [через форму] ниже», — говорится на сайте OpenAI. Дополнительно собрать отзывы и показать прототипы модели компания хочет на мероприятиях, которые проведёт сама. Первое через несколько недель пройдёт в Сан-Франциско, за ним последуют встречи в Европе и Азиатско-Тихоокеанском регионе. OpenAI приходится всё активнее отбивать атаки конкурентов, в том числе китайской DeepSeek, которые выпускают открытые модели ИИ. Конкуренты позволяют сообществу использовать эти системы как для экспериментов, так и в коммерческих целях. Значительные средства в разработку моделей семейства Llama вложила Meta✴ — в марте эти модели набрали более 1 млрд загрузок. Большую базу пользователей быстро собрала DeepSeek. «[Лично я считаю,] нам нужно выработать другую стратегию в отношении открытого исходного кода. Эту точку зрения в OpenAI разделяют не все, и сейчас это нашим приоритетом не является. [В будущем] мы станем выпускать лучшие модели, но наше лидерство станет меньшим, чем в предыдущие годы», — рассказал ранее глава OpenAI Сэм Альтман (Sam Altman). Новая открытая модель будет поддерживать функцию рассуждений, добавил он накануне в соцсети X. Компания проведёт все стандартные проверки, как перед выпуском коммерческих моделей, и ряд дополнительных, учитывая, что после выпуска пользователи начнут её дорабатывать самостоятельно. Развёртывать её будут крупные компании и правительственные учреждения, считает господин Альтман. Завирусившийся новый генератор изображений в ChatGPT стал доступен всем пользователям
01.04.2025 [11:24],
Владимир Фетисов
Новый генератор изображений OpenAI, работающий на базе большой языковой модели GPT-4o, теперь доступен всем пользователям. Об этом на своей странице в социальной сети X написал гендиректор OpenAI Сэм Альтман (Sam Altman). До этого момента использовать новый ИИ-генератор изображений могли только платные подписчики ChatGPT. ![]() Источник изображения: OpenAI Бесплатные пользователи сервиса сейчас могут генерировать не больше двух изображений в сутки. Ранее Альтман упоминал о возможности введения лимита в три изображения в день. Инструмент генерации изображений OpenAI мгновенно стал сверхпопулярным сразу после его запуска в массы. Альтман заявлял, что спрос на генерацию картинок был так высок, что используемые компанией графические ускорители попросту «плавились». Генератор быстро стал известен тем, что его использовали для преобразования изображений в стиль японской анимационной студии Studio Ghibli. Это вызвало обеспокоенность по поводу нарушения авторских прав, поскольку создаваемые ИИ-генератором изображения были очень похожи на работы студии. Некоторые люди также использовали данный инструмент для создания поддельных квитанций, например, ресторанных счетов. В компании на это заявили, что все сгенерированные ИИ изображения содержат метаданные, указывающие на их происхождение. Вместе с этим OpenAI заявила о привлечении $40 млрд инвестиций, за счёт чего рыночная стоимость компании составила $300 млрд. В качестве основного инвестора в рамках этого раунда финансирования выступил Softbank. Компания также объявила, что ИИ-бот ChatGPT еженедельно используют более 500 млн человек по всему миру, тогда как количество ежемесячно активных пользователей выросло до 700 млн человек. OpenAI привлекла $40 млрд инвестиций от «синдиката инвесторов» — деньги пойдут на создание AGI
01.04.2025 [11:07],
Павел Котов
В ходе очередного раунда финансирования OpenAI привлекла $40 млрд от группы инвесторов во главе с SoftBank — разработчика ИИ при этом оценили в $300 млрд. Это крупнейший в истории раунд финансирования частной технологической компании, сообщает CNBC. ![]() Источник изображения: Mariia Shalabaieva / unsplash.com OpenAI получит авансом $10 млрд, $7,5 млрд из которых поступят от SoftBank и $2,5 млрд — от «синдиката инвесторов». Остальные $30 млрд будут переведены к концу года при условии, что к тому времени OpenAI проведёт реорганизацию и станет коммерческой компаний. В противном случае объём сделки сократится на четверть. В январе OpenAI объявила о проекте Stargate — совместное предприятие с бюджетом $500 млрд при поддержке SoftBank, Oracle и фонда MGX из Абу-Даби в ближайшие четыре года намеревается построить сеть гигантских центров обработки данных для систем искусственного интеллекта. Сейчас компания в ударе: накануне её гендиректор Сэм Альтман (Sam Altman) сообщил, что всего за час платформа привлекла 1 млн пользователей благодаря функции Images в ChatGPT, ставшей вирусной из-за возможности генерировать изображения в стиле аниме Studio Ghibli. В ближайшие месяцы OpenAI намеревается выпустить мощную большую языковую модель с открытыми весами. Еженедельная аудитория сервисов OpenAI составляет 500 млн пользователей, сообщалось в ходе раунда финансирования. Несмотря на бурный рост из-за ChatGPT, у компании сохраняются колоссальные издержки. По итогам текущего года она намеревается получить $12,7 млрд дохода — в прошлом году этот показатель был $3,7 млрд. На положительный денежный поток компания намеревается выйти в 2029 году, когда её выручка достигнет $125 млрд. В ходе раунда финансирования OpenAI в очередной раз озвучила цель своей работы — «создание сильного ИИ (AGI), который принесёт пользу всему человечеству». Для достижения этой цели компании потребуются значительные вычислительные и энергетические ресурсы, глобальная инфраструктура и очень большие деньги, дал понять Сэм Альтман. Amazon представила ИИ-агента Nova Act, который заменит человека в интернет-серфинге
31.03.2025 [18:03],
Сергей Сурабекянц
Amazon представила универсального ИИ-агента Nova Act, который может управлять веб-браузером и самостоятельно выполнять некоторые простые действия. В будущем Nova Act будет поддерживать все функции Alexa+ — обновлённого голосового помощника Amazon. Одновременно с агентом компания выпустила набор инструментов Nova Act SDK, который позволяет разработчикам создавать собственные прототипы агентов. ![]() Источник изображения: Pixabay Nova Act разработан недавно открытой в Сан-Франциско лабораторией AGI Amazon, возглавляемой бывшими исследователями OpenAI Дэвидом Луаном (David Luan) и Питером Аббелем (Pieter Abbeel). Amazon называет выпуск ИИ-агента «исследовательским предварительным просмотром». Разработчики уже сейчас могут получить доступ к набору инструментов Nova Act на специализированном ресурсе nova.amazon.com, который также служит «витриной» для различных моделей Nova Foundation от Amazon. Nova Act — это попытка Amazon составить конкуренцию OpenAI Operator и Anthropic Computer Use с помощью технологии агентов ИИ общего назначения. Многие лидеры рынка искусственного интеллекта считают, что агенты ИИ, которые могут исследовать интернет по заданию пользователей, сделают чат-ботов ИИ значительно более полезными. Amazon рассчитывает, что распространённость Alexa+ обеспечит новому агенту широкий охват. Разработчики, использующие Nova Act SDK, смогут автоматизировать базовые действия от имени пользователей, такие как заказ продуктов или бронирование столика в ресторане. С помощью Nova Act разработчики могут объединить инструменты, которые позволят ИИ-агенту перемещаться по веб-страницам, заполнять формы или выбирать даты в календаре. По данным Amazon, Nova Act превосходит агентов от OpenAI и Anthropic в нескольких внутренних тестах компании. Например, в ScreenSpot Web Text, который измеряет, как агент ИИ взаимодействует с текстом на экране. Nova Act набрал 94 %, превзойдя CUA OpenAI (88 %) и Claude 3.7 Sonnet от Anthropic (90 %). По мнению экспертов, основная проблема с недавно выпущенными ИИ-агентами от OpenAI, Google и Anthropic заключается в их низкой надёжности. Во многих тестах они работают медленно, с трудом принимают самостоятельные решения и склонны к ошибкам, которые человек бы не допустил. В скором времени станет ясно, удалось ли Amazon избавить свой продукт от этих недостатков. «Наши GPU плавятся»: ажиотаж вокруг нового генератора картинок в ChatGPT заставил OpenAI ввести ограничения
27.03.2025 [22:21],
Владимир Мироненко
Представленная на днях функция 4o Image Generation генерации качественных изображений вызвала огромный интерес у пользователей. Ажиотаж даже вынудил OpenAI «временно» ограничить частоту отправки запросов на генерацию изображений, сообщил в соцсети X гендиректор компании Сэм Альтман (Sam Altman). «Очень забавно наблюдать, как людям нравятся изображения в ChatGPT, но наши графические процессоры плавятся», — отметил он в своём сообщении. ![]() Источник изображения: OpenAI Альтман не уточнил, какой предел скорости был установлен, лишь выразив надежду, что это ограничение не понадобится надолго, поскольку OpenAI пытается повысить эффективность обработки огромного числа запросов. Высочайший спрос уже заставил компанию отсрочить запуск обновлённого генератора изображений на базе GPT-4o для бесплатных пользователей ChatGPT — Альтман ранее пообещал, что бесплатные пользователи «скоро» смогут генерировать с его помощью до трёх изображений в день. Но, по-видимому, этого оказалось недостаточно, чтобы как-то снизить нагрузку на инфраструктуру OpenAI. Улучшенный инструмент генерации изображений использует мультимодальную большую языковую модель GPT-4o. Получающиеся с его помощью изображения выглядят качественно, более реалистично и лучше соответствуют запросам. Также имеются успехи в преодолении прошлых проблем, например, с отображением текста. В интервью ресурсу The Verge представитель компании назвал улучшение генерации как «шаговое изменение» по сравнению с предыдущими моделями. Тем не менее возникшие проблемы служат напоминанием о том, сколько технической мощности и энергии требуется для реализации функции генерации изображений в ChatGPT, отметил The Verge. Microsoft вынашивает идею разработки собственного мощного ИИ
27.03.2025 [15:19],
Алексей Разин
Выступающая в роли крупнейшего инвестора OpenAI корпорация Microsoft до сих пор предпочитала полагаться на возможности больших языковых моделей первой и её же чат-бота ChatGPT, но в дальнейшем не исключена возможность создания собственных производительных систем искусственного интеллекта, как дал понять генеральный директор Сатья Наделла (Satya Nadella). ![]() Источник изображения: Microsoft Соответствующие заявления он сделал в интервью группе японских журналистов во время своего визита в Токио, как сообщает Nikkei. По мнению главы Microsoft, создание собственной платформы для искусственного интеллекта позволит оптимизировать работу с программным обеспечением корпорации для корпоративных клиентов. «Мы построим свои собственные возможности для дополнения всего того, что мы делаем с OpenAI», — заявил Наделла. Внедрять собственный ИИ в приложения и сервисы для корпоративного сегмента Microsoft будет в том случае, если поймёт, что он будет полезен для потребителей. Microsoft не только адаптирует решения OpenAI к своей программной инфраструктуре. Компания расширит команду разработчиков приложений для искусственного интеллекта, и ожидается, что со временем её собственные разработки в этой сфере не будут уступать передовым решениям OpenAI. «Мы все будем подчиняться реальному спросу. То, куда пойдёт ИИ, будет зависеть исключительно от происходящего с мировым ростом ВВП», — пояснил глава Microsoft стратегию инвестиций в сферу искусственного интеллекта. В прошлом году Microsoft открыла в Японии первый исследовательский центр, связанный с разработкой ИИ для робототехники и автомобилей. Корпорация полна готовности глубоко сотрудничать с японскими компаниями и разработчиками, использующими открытый исходный код. Наделла считает, что использование единых стандартов в сфере безопасности ИИ пойдёт на пользу всем и сократит возможные издержки, связанные с рисками. OpenAI рассчитывает более чем утроить выручку в этом году, а затем удвоить её в следующем
27.03.2025 [04:46],
Алексей Разин
Занимающая лидирующие позиции на рынке систем генеративного искусственного интеллекта компания OpenAI номинально остаётся стартапом, её финансовая отчётность официально не публикуется, поэтому приходится получать данные из неофициальных источников. Они гласят, что в текущем году выручка OpenAI вырастет более чем в три раза. ![]() Источник изображения: OpenAI В прошлом году, по имеющимся у Bloomberg данным, выручка компании не превысила $3,7 млрд, но в этом прогнозируется её рост до $12,7 млрд. В следующем году темпы роста замедлятся, но выручка всё равно увеличится более чем в два раза до $29,4 млрд. По данным на сентябрь прошлого года, OpenAI на тот момент рассчитывала выручить в 2025 году только $11,6 млрд. OpenAI несёт огромные расходы на развитие вычислительной инфраструктуры и расширение штата сотрудников, поэтому на окупаемость она рассчитывает выйти не ранее 2029 года, когда её выручка достигнет $125 млрд. Значительную часть дохода компания получает от подписчиков ChatGPT. Корпоративной версией чат-бота по состоянию на сентябрь прошлого года пользовался миллион человек. Сейчас для доступа к самым продвинутым языковым моделям OpenAI пользователи должны отдавать по $200 в месяц. Кроме того, руководством компании обсуждается возможность введения тарифного плана, подразумевающего абонентскую плату в размере нескольких тысяч долларов в месяц. Капитализация OpenAI оценивается в $300 млрд, но чтобы привлечь больше инвесторов, она должна изменить организационную структуру, поскольку сейчас ею командует некоммерческая организация. OpenAI решила попридержать запуск 4o Image Generation для бесплатных пользователей
27.03.2025 [04:24],
Анжелла Марина
Компания OpenAI вынуждена перенести сроки предоставления доступа к встроенному генератору изображений в ChatGPT для пользователей бесплатной версии. Сэм Альтман (Sam Altman) в своём сообщении признал, что новый инструмент 4o Image Generation оказался популярнее, чем ожидалось, поэтому развёртывание для бесплатного использования будет отложено на некоторое время, сообщает The Verge. ![]() Источник изображения: OpenAI Новый ИИ-генератор изображений был интегрирован в ChatGPT буквально на днях. С его помощью можно создавать картинки непосредственно в приложении, используя новейшую модель рассуждений GPT-4o. Функция так понравилась пользователям, что они уже вовсю стали делиться в социальных сетях изображениями, в частности, стилизованными под работы студии Ghibli, — тренд, к которому присоединился даже сам Альтман. По словам разработчиков, 4o Image Generation отличается улучшенным рендерингом текста и использует для генерации изображений так называемый авторегрессионный подход, когда изображение создаётся последовательно, слева направо и сверху вниз, а не одномоментно целиком, что позволяет создавать картинки без каких-либо ошибок или искажений в тексте, чего раньше добиться в других генераторах не удавалось. В настоящее время доступ к функции имеют только подписчики платных тарифов ChatGPT Plus, Pro и Team. Когда именно пользователи бесплатной версии смогут опробовать новый ИИ-генератор, пока не совсем ясно из-за неожиданно высокого спроса на эту функцию. OpenAI представила функцию генерации точных изображений в ChatGPT на базе GPT-4o — она доступна бесплатно
26.03.2025 [01:03],
Анжелла Марина
OpenAI встроила функцию генерации точных изображений непоcредственно в ChatGPT. Новая функция, именуемая 4o Image Generation, опирается на мультимодальную большую языковую модель GPT-4o. Она понимает контекст, сложные инструкции, взаимодействия объектов и даже генерирует текстовые надписи без артефактов. Доступ для всех откроют сегодня. ![]() Источник изображений: OpenAI ChatGPT и прежде умел генерировать изображения с помощью нейросети Dall-E 3. Однако обновлённая функция работает куда лучше и точнее. Представитель OpenAI Тайя Кристиансон (Taya Christianson) уточнила, что лимиты для бесплатных пользователей останутся такими же, как у DALL-E, то есть три изображения в день. Доступ к DALL-E по-прежнему возможен через пользовательский интерфейс ChatGPT. Как отметил глава исследований Габриэль Го (Gabriel Goh), использование GPT-4o позволяет ИИ работать с любыми типами данных — текстом, изображениями, аудио и видео. Кроме того, Sora получила ключевое улучшение, заключающееся в корректном соотношении атрибутов и объектов (binding). Го объяснил, что большинство ИИ путаются при обработке 5–8 элементов. Например, ИИ может получить запрос нарисовать синюю звезду и красный треугольник, но создать красную звезду и нечто отличное от треугольника. 4o Image Generation справляется с 15–20 объектами без ошибок. ![]() Пользователи также заметят улучшение в отрисовке текста, что позволяет генерировать на изображениях читаемый текст без опечаток. В существующих инструментах для генерации изображений текст часто искажался и достижение качественного рендеринга в этом смысле было серьёзной проблемой, так как даже небольшие ошибки в заголовках или текстовых элементах могут сделать всё изображение полностью непригодным. ![]() Генерация по запросу «Cделай очень красочную ризографию о том, как приготовить матча» (make a very colorful risograph on how to make matcha) Система также использует теперь нестандартный метод генерации. Изображения создаются последовательно, слева направо и сверху вниз, а не целиком, как это происходит в DALL-E. По мнению Го, это объясняет превосходство 4o Image Generation в работе с текстом и сложными сценами. ![]() OpenAI продемонстрировала возможности 4o Image Generation на научных диаграммах, например, эксперимент Ньютона с призмой, комиксах и постерах. Также были показаны практические применения в создании изображений с прозрачным фоном для стикеров, меню ресторанов и логотипов. 4o Image Generation со всеми заданиями справилась успешно, не допустив в тексте никаких ошибок. Также 4o Image Generation способен редактировать загруженные пользователем изображения по простым запросам, добавляя на них элементы или наоборот убирая. ![]() Пример добавление элементов на фотографию с помощью GPT-4o Однако новая система генерирует изображения дольше, чем предыдущие, но OpenAI считает это оправданным компромиссом. «Хотя у нас определённо есть возможности для улучшения времени отклика, качество этих изображений, возможности, знание о мире действительно компенсируют дополнительные секунды ожидания», — сказали в компании. ![]() Отвечая на вопросы о мерах безопасности, упоминая скандальные дипфейки Тейлор Свифт (Taylor Swift), созданные с помощью модели Microsoft, способность Grok от xAI изобразить Камалу Харрис (Kamala Harris) с оружием и удаление водяных знаков в Google Gemini, команда OpenAI подчеркнула наличие надёжных механизмов защиты от злоупотреблений. Директор по дизайну OpenAI Шеннон Джагер (Jackie Shannon) заявила, что инструмент предотвращает удаление водяных знаков, блокирует генерацию дипфейков, связанных с телом человека и отказывает в запросах на создание материалов с различным родом насилия над детьми (CSAM). Кроме того, Шеннон пояснила, что все сгенерированные изображения будут включать стандартные метаданные C2PA, чтобы отметить изображение как созданное OpenAI. OpenAI: ИИ бесполезно наказывать за ложь — он начинает хитрить ещё больше
25.03.2025 [16:56],
Павел Котов
Галлюцинации, то есть заведомо неверные ответы, которые иногда дают модели искусственного интеллекта, стали одной из основных проблем всей отрасли — из-за этого некоторые граждане вообще отказываются пользоваться ИИ. Избавиться от таких сбоев может оказаться сложнее, чем предполагалось ранее, выяснили исследователи OpenAI. ![]() Источник изображения: openai.com Учёные компании OpenAI опубликовали результаты исследования, в котором описали свои попытки наладить управление сложными, в том числе рассуждающими, моделями ИИ, чтобы не допустить их выхода за установленные рамки. Исследователи применяли уникальные стратегии и методы, в том числе наказания за вредоносные действия и попытки обмануть пользователя. В проекте использовалась, помимо прочего, некая созданная OpenAI, но не вышедшая на рынок модель ИИ, которой поручали различные задачи — их выполнение можно было облегчить, обманув пользователя или отбросив некоторые действия. Результат обучения модели во многом зависит от этапа обучения с подкреплением, когда за выполнение команды или генерацию правильного ответа она получает вознаграждение. Моделям ИИ свойственно пытаться получить вознаграждение посредством манипуляций, в том числе нарушая некоторые правила и рекомендации, чтобы добиться желаемого результата. Исследователи надеялись, что смогут выявить лазейки и лучше понять поведение ИИ, отслеживая цепочку её рассуждений, но это не помогло. Попытки оптимизировать цепочку рассуждений напрямую, то есть отдать команду не обходить инструкции, дают лишь краткосрочный эффект, установили учёные: «это не устраняет всё нежелательное поведение и может привести к тому, что модель станет скрывать свои истинные намерения». Авторам проекта пришлось признать, что механизмы мониторинга моделей «хрупки». Строгий надзор за цепочкой рассуждений может побудить ИИ скрывать свои ошибки, чтобы обеспечить себе вознаграждение в обход ограничений. Для наблюдения за испытуемой моделью при выполнении заданий по написанию программного кода использовалась коммерческая GPT-4o — подопытная же допускала небрежности и открыто признавала в цепочке рассуждений, что делала это для получения вознаграждения; например, она преждевременно завершала выполнение некоторых программ. После этого исследователи попытались наказать модель, но эффект от этого оказался недолговечным: в цепочке рассуждений оставались признаки попытки получить вознаграждение обходными путями и дать неправильный ответ. То есть она нашла способ скрывать свои мотивы от контролирующего ИИ. В этой связи остаётся неясным, готов ли мир к ИИ уровня человека, если проблема сохранится, и вмешиваться человек уже не сможет. Исследователи выразили надежду, что в будущем появятся способы оказывать влияние на модели через их цепочку рассуждений без обмана и скрытых тактик — они предлагают сделать методы оптимизации менее навязчивыми и прямолинейными. Голосовая версия ChatGPT стала приятнее в общении, сообщили в OpenAI
25.03.2025 [12:07],
Павел Котов
OpenAI накануне обновила функцию Advanced Voice Mode — формат голосового общения с ChatGPT в реальном времени. Помощник с искусственным интеллектом стал приятнее в общении и научился реже прерывать пользователей. ![]() Источник изображения: openai.com С последним обновлением OpenAI попыталась решить проблему, характерную для многих голосовых помощников с ИИ — они часто прерывают пользователей, если те приостанавливают речь, чтобы подумать или сделать глубокий вдох. Обновлённая версия Advanced Voice Mode стала доступной для пользователей бесплатного варианта ChatGPT, которая теперь позволяет делать продолжительные паузы в речи и не прерывает собеседника. Подписчики платных вариантов сервиса, в том числе тарифов ChatGPT Plus, Teams, Edu, Business и Pro получили не только более деликатного, но и более индивидуализированного голосового помощника — его ответы стали «более прямыми, интересными лаконичными, конкретными и творческими», рассказали в OpenAI. OpenAI зарекомендовала себя как мирового лидера в области искусственного интеллекта, но ей приходится прилагать всё более значительные усилия, чтобы оставаться впереди конкурентов. В сегменте голосовых помощников в последнее время вирусную популярность приобрёл стартап Sesame соучредителя Oculus Брендана Ирибе (Brendan Iribe) — он выпустил варианты сервиса Maya и Miles, которые отличаются естественным звучанием. Голосовых помощников с мощным ИИ выпускают и крупные игроки: Amazon недавно представила Alexa+ с генеративным ИИ, а Apple была вынуждена перенести выпуск поумневшей Siri, что обернулось нешуточным скандалом. |
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |