Сегодня 10 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии-сервис
Быстрый переход

Intel и SambaNova запустили продукт, способный потеснить Nvidia в ИИ-сегменте

Компании Intel и SambaNova анонсировали готовую к производству гетерогенную архитектуру для ИИ-инференса, которая распределяет задачи между разными типами оборудования. Платформа использует графические процессоры для предварительной обработки, специализированные модули SambaNova для генерации токенов и процессоры Xeon 6 для управления агентскими задачами.

 Источник изображения: ***

Источник изображения: Meta✴

Разработанная система разделяет процесс логического вывода на отдельные этапы, где каждый тип чипа выполняет свою специфическую функцию. Графические ускорители или ИИ-акселераторы занимаются первичной обработкой длинных запросов (ingest) и созданием кешей ключ-значение, в то время как реконфигурируемые блоки данных SN50 от SambaNova отвечают за декодирование. В свою очередь процессоры Intel Xeon 6 координируют распределение нагрузки и выполняют операции, связанные с ИИ-агентами, такие как компиляция кода и валидация результатов. Это позволит охватить максимально широкий спектр рабочих нагрузок и конкурировать с Nvidia и другими игроками рынка.

 Источник изображения: SambaNova

Источник изображения: SambaNova

Такой подход к разделению prefill, decode и генерации токенов, как отмечает Tom's Hardware, перекликается со стратегией Nvidia в её будущей платформе Rubin, где аналогичные функции должны были распределяться между чипами Rubin CPX и Rubin GPU. Однако ключевое отличие в том, что решение Nvidia пока не вышло на рынок, тогда как Intel и SambaNova смогут предложить готовую к внедрению архитектуру уже во второй половине 2026 года.

По внутренним оценкам SambaNova, процессоры Xeon 6 ускоряют компиляцию LLVM более чем на 50 % по сравнению с серверными чипами на архитектуре Arm. Кроме того, их производительность в задачах с векторными базами данных на 70 % превышает показатели конкурирующих x86-решений, таких как AMD EPYC. По словам представителей компаний, такой прирост эффективности достигается за счёт оптимизации взаимодействия между компонентами системы и позволяет существенно сократить циклы разработки кодирующих агентов и других ИИ-приложений полностью собственными силами.

Ключевым преимуществом новой архитектуры стала её полная совместимость с существующей инфраструктурой дата-центров, поддерживающих мощность до 30 кВт. Это позволяет предприятиям внедрять решение без необходимости масштабной модернизации систем охлаждения и энергоснабжения. Ожидается, что платформа станет доступна для корпоративных клиентов, облачных операторов и национальных государственных инициатив в области искусственного интеллекта во второй половине 2026 года.

Исполнительный вице-президент и генеральный директор группы центров обработки данных (DCG) Intel Кеворк Кечичян (Kevork Kechichian) отметил, что экосистема программного обеспечения дата-центров исторически построена на x86, что гарантирует, по его мнению, Xeon роль надёжного фундамента для будущих гетерогенных вычислений.

Meta✴ вернулась в ИИгру: «Лаборатория суперинтеллекта» представила мощную нейросеть Muse Spark

Meta✴ выпустила новую ИИ-модель под названием Muse Spark после того, как Марк Цукерберг (Mark Zuckerberg) потратил миллиарды долларов на масштабную перестройку этого направления компании и создания ИИ-подразделения Superintelligence Labs. Модель уже работает в фирменном приложении Meta✴ AI и на веб-сайте Meta✴ AI в США, и в ближайшие недели станет доступна также в других странах.

 Источник изображения: ***

Источник изображений: Meta✴

По данным The Verge, Muse Spark создана специально для экосистемы Meta✴ и позволяет запускать сразу несколько ИИ-агентов для более быстрой и точной обработки запросов. Система поддерживает мультимодальный ввод для одновременной обработки различных форм информации, например, текста и изображений, что особенно важно для работы умных очков Ray-Ban. Позднее сервисы WhatsApp, Instagram✴, Facebook✴ и Messenger также получат Muse Spark. Некоторым партнёрам Meta✴ уже открыла доступ к API в рамках закрытого предварительного просмотра.

Пользователи смогут выбирать между режимом Instant для быстрых ответов и режимом Thinking для сложных задач, требующих глубокого анализа, аналогично функциям конкурентов. Особый акцент сделан на вопросах здоровья. Нейросеть способна анализировать медицинские графики и изображения, давая развёрнутые ответы по примеру специализированных медицинских ботов от OpenAI и Anthropic. Meta✴ продемонстрировала возможности ИИ по подсчёту калорий по обычному фото продуктов питания:

Muse Spark также станет основой для будущих функций, которые будут учитывать рекомендации и контент, которым пользователи делятся в Instagram✴, Facebook✴ и Threads. Руководство компании описывает текущую модель как ранний этап развития серии Muse, подтверждая планы по открытию исходного кода для будущих версий. Серия Muse станет вторым крупным проектом Meta✴ следующим за Llama после менее успешного релиза предыдущего поколения моделей.

Anthropic привлекла рекордное количество подписчиков после скандала с Минобороны США

Конфликт с Минобороны США и забавная реклама против ChatGPT неожиданно сыграли на руку Anthropic. Аналитика анонимизированных транзакций по кредитным картам примерно 28 млн американских пользователей, проведённая компанией Indagari по заказу издания TechCrunch, продемонстрировала рекордный приток платных подписчиков к нейросети Claude.

 Источник изображения: Anthropic

Источник изображения: Anthropic

Хотя точное количество пользователей не раскрывается и оценивается в диапазоне от 18 до 30 млн, официальный представитель Anthropic сообщил журналистам, что в текущем году количество платных подписок увеличилось более чем вдвое. В свою очередь Indagari подчёркивает, что эти данные не учитывают корпоративный сегмент, который является основным источником дохода, а также бесплатных пользователей.

Отмечается, что в феврале зафиксировано рекордное возвращение предыдущих пользователей, что совпало с несколькими ключевыми событиями. В частности, в январе Anthropic выпустила серию рекламных роликов во время трансляции Супербоула, которые в ироничной форме критиковали OpenAI за решение размещать в ChatGPT рекламные объявления.

 Источник изображения: techcrunch.com

Источник изображений: techcrunch.com

Однако более значительный эффект оказал громкий конфликт с Министерством обороны США. В конце января ряд СМИ, включая The Wall Street Journal и Axios, сообщили о разногласиях между Anthropic и ведомством из-за того, что компания отказалась разрешить использование своих ИИ-моделей для боевых операций с уничтожением целей, а также для массовой слежки за американскими гражданами.

Конфликт обострился 26 февраля, когда генеральный директор Anthropic Дарио Амодеи (Dario Amodei) выступил с жёстким публичным заявлением на фоне угроз Министерства обороны признать компанию источником угроз для цепочки поставок. Ведомство реализовало это намерение, после чего последовали судебные разбирательства. Однако федеральный судья временно заблокировал решение министерства. Согласно данным аналитиков, рост новых пользователей резко ускорился именно в период между первыми публикациями в СМИ в конце января и заявлением Амодеи в конце февраля.

Помимо скандала, драйверами роста подписок стали инструменты для разработчиков Claude Code и Claude Cowork, выпущенные в январе. Кроме того, представители Anthropic сообщили TechCrunch, что новая функция Computer Use, позволяющая ИИ самостоятельно управлять компьютером, также вызвала всплеск интереса. Несмотря на значительный интерес к сервису, TechCrunch констатирует, что Claude пока остаётся позади ChatGPT по числу платящих пользователей.

Google открыла доступ к «Персональному интеллекту» бесплатным пользователям Chrome, Gemini и AI Mode

Google объявила о запуске функции «Персональный интеллект» (Personal Intelligence) для бесплатных пользователей. Ранее возможность была доступна только подписчикам платных тарифов Google AI. Теперь технологию интегрируют в приложение Gemini, браузер Chrome через веб-версию Gemini, а также в новый режим ИИ (AI Mode).

 Источник изображений: Google

Источник изображений: Google

Суть обновления заключается в том, что искусственный интеллект учится использовать личные данные пользователя для генерации ответов, не требуя детальных уточнений в запросе. Система анализирует информацию из экосистемы Google: Workspace (включая Gmail, «Календарь» и «Диск»), «Google Фото», YouTube, «Google Карты» и «Поиск». Далее, как уточняет 9to5Google, ИИ обрабатывает текст, фото и видео, чтобы понять предпочтения владельца аккаунта и адаптировать ответы под пользователя.

В качестве примеров работы системы приводятся несколько сценариев. Пользователи могут получить помощь в решении технических проблем, даже не помня точное название купленного продукта: достаточно описать неисправность, и система предложит шаги по отладке, такие как перезагрузка или сброс настроек, определив точную модель устройства по квитанциям о покупке.

В дальних поездках функция поможет сориентироваться, например, во время пересадки: автоматически укажет выходы на посадку, предложит варианты питания с учётом вкусов пользователя, рассчитает остаток времени до вылета. Также доступно создание индивидуальных маршрутов вместо стандартных списков «топ-10» — с рекомендациями местных достопримечательностей на основе прошлых интересов.

Распространение функции для бесплатных пользователей приложения Gemini и Gemini в Chrome начнётся на территории США. Для работы потребуется личный аккаунт Google и обязательное ручное включение функции. При этом пользователи смогут отключать доступ к определённым приложениям, а в меню аккаунта появится соответствующий раздел — «Персональный интеллект».

ByteDance отложила глобальный запуск ИИ-генератора видео Seedance 2.0 из-за проблем с авторскими правами

Соблазн использования уже знакомых образов и сюжетов при генерации видео с помощью искусственного интеллекта весьма высок, поскольку это упрощает задачу создателю и одновременно позволяет гарантировать интерес аудитории к конечному результату. ByteDance решила отложить глобальный запуск генератора видео Seedance 2.0 из-за проблем с авторскими правами.

 Источник изображения: ByteDance

Источник изображения: ByteDance

Как отмечает Reuters со ссылкой на The Information, соответствующие трудности возникли у китайской компании в сфере взаимоотношений с крупными голливудскими студиями и стриминговыми платформами. Ещё в прошлом месяце ByteDance была вынуждена заявить, что предпримет меры для предотвращения неправомерного использования интеллектуальной собственности в работе ИИ-генератора видео Seedance 2.0 после того, как некоторые американские студии типа Disney пригрозили ей судебным преследованием.

По версии Disney, компания ByteDance использовала персонажей, чьи образы принадлежат студии, для обучения Seedance 2.0 без соответствующего разрешения. Поводом для претензий стало распространение в китайских социальных сетях вирусного видео, на котором сгенерированные ИИ двойники Тома Круза (Tom Cruise) и Брэда Питта (Brad Pitt) участвуют в поединке. Как считает Disney, при обучении Seedance 2.0 китайская ByteDance использовала полученные незаконным способом образы персонажей из популярных кинофраншиз, включая Star Wars и Marvel, обращаясь с ними, как с общедоступными материалами.

Представившая ИИ-генератор Seedance 2.0 на китайском рынке в феврале ByteDance отмечала, что он предназначен для профессионального использования при производстве фильмов и рекламных роликов. Способность данного продукта одновременно обрабатывать текст, изображения, видео и аудио, по словам представителей компании, позволяет снизить затраты на изготовление контента. Первоначально ByteDance намеревалась открыть доступ к Seedance 2.0 клиентам за пределами Китая в середине марта, но из-за потенциальных проблем с авторскими правами решила задержать график. Как отмечается, сейчас технические специалисты работают над внедрением защитных механизмов от использования охраняемых авторским правом персонажей, а юристы дополнительно прорабатывают правовые основы использования ИИ-модели.

ChatGPT получил визуальную функцию, которая «заставит» полюбить математику

Компания OpenAI представила новую функцию ChatGPT под названием «динамические визуальные объяснения» (dynamic visual explanations). Функция позволяет не просто читать разъяснения математических и научных концепций в виде текста, а взаимодействовать с интерактивными модулями в реальном времени.

 Источник изображения: xAI

Источник изображения: xAI

Как поясняет TechCrunch, принцип работы прост. Если спросить, что такое уравнение линзы или как найти площадь круга, ChatGPT выдаст не только текст, но и представит визуальный модуль, в котором можно менять значения переменных и мгновенно наблюдать за изменениями. Например, при изучении теоремы Пифагора можно регулировать длины сторон треугольника и видеть, как пересчитывается гипотенуза.

 Источник изображения: OpenAI

Источник изображения: OpenAI

На данный момент интерактивная визуализация доступна для более чем 70 тем по математике и естественным наукам. Среди них — биномиальный квадрат, закон Шарля, площадь круга, сложные проценты, закон Кулона, разность квадратов, экспоненциальный распад, закон Гука, кинетическая энергия, линейные уравнения и закон Ома. Функция доступна всем авторизованным пользователям ChatGPT, а список тем будет постепенно расширяться.

Запуск нового инструмента примечателен тем, что он смещает роль ChatGPT от простой выдачи готовых ответов к вовлечению пользователя в процесс понимания, отмечает TechCrunch. Приведёт ли это к более глубокому усвоению материала, во многом будет зависеть от того, как именно люди станут использовать эту возможность.

По данным OpenAI, более 140 миллионов человек еженедельно обращаются к ChatGPT с вопросами, связанными с математикой и естественными науками — то есть, теми предметами, которые традиционно вызывают трудности у учащихся. При этом в образовательном сообществе продолжаются споры: часть педагогов опасается чрезмерной зависимости от ИИ, тогда как многие учителя и студенты уже активно интегрируют технологию в учебный процесс.

Отметим, новая функция дополняет другие образовательные инструменты ChatGPT, в частности, режим обучения, который пошагово ведёт пользователя через решение задач, и QuizGPT, позволяющий создавать карточки и проходить тестирование по любой теме. Аналогичную функцию интерактивных диаграмм в ноябре запустил сервис Gemini от Google.

Anthropic запустила  маркетплейс приложений, построенных на её ИИ-моделях — по примеру Amazon

Компания Anthropic представила платформу Anthropic Marketplace, которая позволит корпоративным клиентам приобретать сторонние программные приложения, построенные на базе её моделей. В числе партнёров площадки названы Snowflake, Harvey и Replit, сообщает Bloomberg.

 Источник изображения: Anthropic

Источник изображения: Anthropic

Компания не станет удерживать комиссию с этих покупок и разрешит зачитывать годовые обязательства по расходам на собственные сервисы в счёт оплаты инструментов от третьих сторон, сравнивая такой подход с маркетплейсами программного обеспечения от Amazon и Microsoft.

Bloomberg отмечает, что запуск платформы произошёл в период, когда компания столкнулась с неопределённостью из-за противостояния с Министерством обороны США. Ранее ведомство признало разработчика угрозой для цепочки поставок — статус, который обычно применяют к представителям недружественных стран.

Такое решение создаёт не только риск для дальнейшего сотрудничества с Пентагоном, но и для совместных оборонных проектов с другими компаниями. В Anthropic заявили о намерении оспорить это решение в суде. Кейт Дженсен (Kate Jensen), глава подразделения Anthropic в Северной и Южной Америке, отметила, что компания активно обсуждает ситуацию с клиентами и ожидает сохранения обычного режима работы для большинства заказчиков. «Хорошая новость заключается в том, что, по большей части, мы ожидаем, что для подавляющего большинства наших клиентов все останется по-прежнему», — сказала она.

Генеральный директор Anthropic Дарио Амодеи (Dario Amodei) добавил, что правительственные ограничения сформулированы достаточно узко и не должны повлиять на коммерческую деятельность компании, не связанную с конкретными военными контрактами. В свою очередь представитель Microsoft сообщил, что компания может продолжать сотрудничество с Anthropic в проектах, не относящихся к оборонной сфере. Тем не менее для организаций, работающих с Пентагоном и одновременно с Anthropic, сохраняется значительная неопределённость относительно дальнейшего взаимодействия.

Google предложит музыкантам ИИ-продюсера вместо генератора случайных мелодий — компания поглотила ProducerAI

Музыкальный стартап ProducerAI вошёл в состав экспериментального подразделения Google Labs для создания продвинутой среды аудиопродакшена. Инструмент позволяет не только генерировать треки, но и создавать для них обложки и видеоклипы, используя весь стек нейросетевых технологий компании Google.

 Источник изображения: Grok

Источник изображения: Grok

По сообщению The Verge, сервис работает на базе предварительной версии модели Lyria 3 и даёт возможность создавать аудиоконтент при помощи виртуального агента. Инструмент позволяет генерировать звуки, дорабатывать тексты песен, создавать ремиксы и даже проектировать новые музыкальные инструменты через текстовые команды. Директор по управлению продуктами Google Labs Элиас Роман (Elias Roman) назвал главным преимуществом платформы возможность вести пошаговый полноценный диалог с нейросетью, отметив непригодность метода случайной генерации музыкального материала для получения действительно серьёзного результата.

Помимо Lyria 3 для генерации музыки и чат-бота Gemini, ProducerAI задействует модель Nano Banana для создания обложек альбомов и Veo для генерации видео. При этом во все результаты встраивается водяной знак SynthID, маркирующий ИИ-контент. При разработке платформы команда сотрудничала с The Chainsmokers, Lecrae, Anjulie и другими артистами. Американский диджей и продюсер Алекс Полл (Alex Pall) из The Chainsmokers назвал платформу по-настоящему «выстроенной с учётом опыта музыкантов». ProducerAI была запущена в июле 2025 года как идеологический наследник проекта Riffusion.

Несмотря на то что музыкальная индустрия всё активнее внедряет инструменты искусственного интеллекта для создания песен, например такие, как ElevenLabs, Udio и Suno, многие артисты выражают недовольство ИИ-клонами. Bandcamp даже полностью запретил музыку, созданную с помощью ИИ, на своей платформе, а стриминговый сервис Deezer разработал технологию для её обнаружения с целью понижения в рейтинге треков, созданных с использованием ИИ.

Как отмечает The Verge, ProducerAI останется самостоятельным продуктом в структуре Labs и будет доступен пользователям более чем в 250 странах с лимитированным бесплатным доступом и платной подпиской. Стартовый тариф стоимостью $8 в месяц включает кредиты на создание примерно 600 композиций. Более дорогие планы за $24 и $64 предназначены для активной студийной работы.

ByteDance пообещала отучить ИИ-генератор Seedance 2.0 копировать голливудских актеров и персонажей

Создание видеороликов с помощью ИИ-сервисов сталкивается с рядом юридических претензий, поскольку киностудии, правообладатели и знаменитости не желают допускать копирования их интеллектуальной собственности и образов без разрешения. Китайская ByteDance после запуска профильного сервиса Seedance 2.0 вынуждена была пообещать правообладателям ввести защитные механизмы, которые учитывали бы их интересы.

 Источник изображения: ByteDance

Как и многие подобные сервисы, Seedance 2.0 позволяет создавать реалистичные видео на основе текстовых запросов. Социальные сети после запуска Seedance 2.0 сразу же наводнились видеороликами с персонажами, охраняемыми авторским правом, а также образами, напоминающими реальных знаменитостей. Поскольку многие из них имели американское происхождение, то к создателям подобных роликов у правообладателей возникли справедливые претензии.

«Мы принимаем меры по усилению существующих защитных механизмов, чтобы предотвратить неправомерное использование интеллектуальной собственности и схожести (со знаменитостями) со стороны пользователей», — заявили представители ByteDance ресурсу CNBC. Свои претензии к создателям сервиса Seedance 2.0 довольно быстро направила отраслевая ассоциация MPA, которая в США представляет интересы большинства крупных киностудий и платформы Netflix. Она призвала ByteDance решительно пресечь неправомерную активность по использованию защищаемых интеллектуальными правами образов. По словам представителей ассоциации, подобная активность не только нарушает американские законы, но и угрожает миллионам рабочих мест в США.

Студия Disney направила в адрес ByteDance письмо с требованиями прекратить неправомерное использование принадлежащих ей персонажей. По мнению представителей Disney, китайская ByteDance для обучения ИИ-модели якобы использовала полученную пиратским образом библиотеку образов, считая её публично доступной. Ранее Disney подписала соглашение с OpenAI, которое позволяет пользователям ИИ-сервисов последней внедрять в генерируемые видео ряд узнаваемых персонажей, принадлежащих студии. Требования прекратить нарушение прав в сфере интеллектуальной собственности в адрес ByteDance на прошлой неделе направила и Paramount Skydance.

xAI выпустила Grok Imagine 1.0 с поддержкой создания 10-секундных видео в улучшенном разрешении

Компания xAI представила масштабное обновление инструмента генерации видео Grok Imagine 1.0. В новой версии теперь можно создавать ролики длиной до 10 секунд в разрешении 720 пикселей и синхронизировать звук. ИИ стал лучше понимать текстовые запросы и научился работать с уточняющими инструкциями.

 Источник изображения: Grok

Источник изображения: Grok

Как сообщает издание Mint, разработчики назвали этот релиз крупнейшим обновлением системы, а Илон Маск (Elon Musk) в своём сообщении подтвердил, что версия 1.0 уже доступна. Представители xAI отметили, что обновление привнесёт повышение чёткости изображения и плавности визуального ряда для эффективного использования в творческих проектах и соцсетях.

Ключевым нововведением стала работа со звуком. Пользователи смогут добавлять персонажам выразительные голоса с эмоциональной окраской, а также накладывать фоновую музыку, которая автоматически синхронизируется с происходящим на экране. В компании считают, что сочетание голоса и музыки делает сгенерированный контент более реалистичным и кинематографичным.

Серьёзные изменения коснулись и логики взаимодействия с нейросетью. Grok Imagine 1.0 научился обрабатывать уточняющие запросы, что позволит корректировать детали сцены и дорабатывать результат без необходимости начинать генерацию с нуля, как это было раньше.

За последние 30 дней платформа уже сгенерировала более одного миллиарда видео и популярность сервиса не уменьшается. Также сообщается, что API-модель показывает сильные результаты в бенчмарках Artificial Analysis, измерящих качество контента, созданного искусственным интеллектом Grok.

Ответ OpenAI: Anthropic превратила Claude в рабочую станцию со встроенными Canva, Slack и Figma

Компания Anthropic объявила о запуске новой функции, позволяющей работать со сторонними приложениями непосредственно в интерфейсе чат-бота Claude. Нововведение направлено на расширение возможностей использования искусственного интеллекта (ИИ) в корпоративной среде и упрощение взаимодействия с привычными сервисами.

 Источник изображений: Anthropic

Источник изображений: Anthropic

Как передаёт TechCrunch, на старте система поддерживает интеграцию с такими сервисами, как Slack, Canva, Figma, Box и Clay, а в ближайшее время разработчики планируют добавить поддержку облачной CRM-платформы Salesforce. Механизм работы предполагает авторизацию в каком-либо сервисе, после чего Claude получает к нему доступ, позволяя выполнять конкретные действия внутри своего интерфейса. Например, отправлять сообщения коллегам в мессенджере, генерировать графики или работать с файлами в облачном хранилище.

В Anthropic считают, что анализ данных, дизайна, контента и в целом управление проектами будет происходить гораздо эффективнее в одном визуальном интерфейсе, что позволит вносить правки быстрее, чем при использовании каждого сервиса по отдельности. Технология аналогична системе внедрения сторонних приложений OpenAI, запущенной в октябре 2024 года. Обе платформы построены на базе открытого стандарта Model Context Protocol (MCP). Доступ к нововведению получили подписчики тарифных планов Pro, Max, Team и Enterprise. Пользователям бесплатной версии функция недоступна. Активация и выбор сервисов происходят через специальный каталог Claude.

Новая статья: Лучшие ИИ-сервисы и приложения 2025 года: боты одолевают

Данные берутся из публикации Лучшие ИИ-сервисы и приложения 2025 года: боты одолевают

xAI Илона Маска представила ИИ для программирования, который отвечает мгновенно

Компания xAI Илона Маска (Elon Musk), представила новую модель искусственного интеллекта для задач программирования под названием Grok Code Fast 1. Модель, которую компания описывает как «быструю и экономичную», призвана сократить время на медленные циклы обработки, характерные для других ИИ-ассистентов.

 Источник изображения: Mariia Shalabaieva/Unsplash

Источник изображения: Mariia Shalabaieva/Unsplash

Grok Code Fast 1 построена на новой архитектуре, для предварительного обучения которой был специально сформирован массив данных, содержащий готовый к применению программный код. Дополнительно модель была дообучена на реальных запросах на внесение изменений в код (Pull Request, PR) и эталонных задачах по написанию кода, что, по утверждению xAI, позволило адаптировать её к практическому использованию. Система обучена работе с такими инструментами и командами, как grep (глобальный поиск регулярных выражений), терминал и редакторы файлов, что делает её пригодной для интеграции в повседневные рабочие процессы внутри популярных интегрированных сред разработки (IDE).

Модель поддерживает несколько языков программирования, включая TypeScript, Python, Java, Rust, C++ и Go. Компания заявляет, что Grok Code Fast 1 способна создавать проекты с нуля, отвечать на сложные вопросы по структуре кодовой базы и исправлять ошибки при минимальном участии разработчика. На тестовом наборе SWE-Bench-Verified, который широко используется для оценки возможностей ИИ в программировании, модель показала результат в 70,8%. При этом в xAI подчёркивают, что ключевую роль в формировании функциональности сыграла обратная связь от реальных разработчиков.

Особое внимание xAI уделила отзывчивости модели. Благодаря новым методам обслуживания и оптимизации кеширования она может практически мгновенно выполнять множественные вызовы инструментов, что позволяет разработчикам видеть результаты в реальном времени без задержек. Главный директор по продукту GitHub Марио Родригес (Mario Rodriguez) отметил в ходе тестирования и скорость, и качество модели в решении агентных задач кодирования, добавив, что эта разработка представляет собой убедительную новую опцию для разработчиков.

xAI подтвердила, что планирует регулярно обновлять Grok Code Fast 1, внедряя улучшения в течение нескольких дней, а не недель. Уже ведётся обучение новой версии модели, которая получит поддержку параллельных вызовов инструментов и увеличенной длины контекста. Как отмечает eWeek, тем самым xAI вступает в гонку с такими компаниями, как Microsoft (с GitHub Copilot) и OpenAI (с Codex), активно развивающими направление автономных ИИ-ассистентов для разработчиков.

Для привлечения первых пользователей модель будет доступна бесплатно в течение одной недели через партнёрские платформы, включая GitHub Copilot, Cursor, Cline, Roo Code, Kilo Code, Opencode и Windsurf. По истечении пробного периода стоимость использования через API xAI составит $0,20 за миллион входных токенов, $1,50 за миллион выходных токенов и $0,02 за миллион закешированных входных токенов. xAI также опубликовала руководство по созданию эффективных промптов для Grok Code Fast.

Google открыла доступ к Vids для всех: ИИ-видеоредактор стал бесплатным, но не без ограничений

Google запустила бесплатную версию видеоредактора Vids, работающего на базе искусственного интеллекта (ИИ). Ранее этот инструмент был доступен исключительно подписчикам Google Workspace и специальных тарифов с ИИ, но теперь все пользователи смогут использовать его базовую версию, которая включает шаблоны, стоковый медиаконтент и ограниченный набор ИИ-возможностей.

 Источник изображений: Google

Источник изображений: Google

Vids, представленный в прошлом году как часть пакета Workspace, предназначен для быстрого создания видео-презентаций. Он помогает пользователям формировать раскадровки, предлагая сцены, подбирая стоковые изображения и фоновую музыку с помощью алгоритмов. Как сообщает The Verge, ссылаясь на слова директора по продукту Вишну Шиваджи (Vishnu Sivaji), упрощённая версия сохраняет значительную часть основных возможностей приложения, однако в ней отсутствуют некоторые новейшие ИИ-функции, анонсированные одновременно с открытием доступа. В частности, бесплатная версия не позволяет использовать ИИ-аватары для озвучивания текста от имени пользователя.

В рамках обновления платные подписчики получат доступ к выбору из 12 готовых аватаров с уникальной внешностью и голосом, в которые можно загружать собственный сценарий. При этом функция создания персонального ИИ-аватара, аналогичная реализованной в Zoom, в Vids пока недоступна. На вопрос о такой возможности Шиваджи ответил, что компания не готова делиться планами на этот счёт.

Также Google расширила возможности генерации видео: теперь можно создавать 8-секундные ролики на основе конкретного изображения, например фотографии нового продукта. Кроме того, появился инструмент, автоматически удаляющий из записи слова-паразиты и паузы, что полезно при подготовке собственных видео для презентаций.

В компании считают, что новые функции помогут бизнесу сэкономить время и деньги при производстве видеоконтента различного назначения, в том числе обучающих роликов, так как, по словам Шиваджи, традиционное производство даже 10-минутного видео с живыми актёрами может занимать до полугода и обходиться в десятки тысяч долларов из-за затрат на написание сценария, его согласование, аренду студии, съёмку и монтаж.

Microsoft представила VibeVoice — открытый ИИ, превращающий текст в полуторачасовые подкасты

Microsoft представила проект с открытым исходным кодом VibeVoice в области искусственного интеллекта — новую систему синтеза речи, способную генерировать из текста аудиоподкасты длительностью до 90 минут на английском или китайском языке. Технология уже доступна для тестирования любому желающему онлайн или с установкой на локальное устройство пользователя.

 Источник изображения: AI

Источник изображения: AI

Разработчики охарактеризовали VibeVoice как новаторский фреймворк, созданный для генерации продолжительного по времени аудиоконтента с несколькими участниками непосредственно из текста. Как пишет Windows Central, система решает ключевые проблемы традиционных синтезаторов речи (TTS), такие как масштабируемость, согласованность характеристик голоса и естественность чередования реплик в диалоге. Модель способна синтезировать аудио продолжительностью до 90 минут с участием до четырёх уникальных голосов, что превосходит ограничения в 1-2 спикера, характерные для многих предыдущих ИИ-моделей.

В настоящее время для тестирования доступны две версии модели: на 1,5 и 7 млрд параметров. Первая может генерировать до 90 минут аудио с длиной контекста 64 тыс. токенов, тогда как вторая, предположительно более качественная из-за большего размера, ограничена 45 минутами и окном в 32 тысячи токенов. Также ожидается выпуск облегчённой версии на 0,5 млрд параметров, предназначенной для работы в реальном времени. Для локальной работы меньшая модель требует около 7 Гбайт видеопамяти, а для большей может потребоваться до 18 Гбайт VRAM.

На текущий момент ИИ-модель VibeVoice обучена только на английском и китайском языках, включая мандаринскую разновидность (севернокитайский или путунхуа). Однако в Microsoft отмечают, что в будущих версиях планируется расширение поддержки других языков. Система способна передавать эмоции, управлять сменой реплик между участниками и генерировать естественные диалоги, хотя попытки воспроизведения музыки пока остаются неудачными. Голоса звучат довольно реалистично, однако их искусственное происхождение остаётся заметным. В перспективе разработчики рассматривают возможность интеграции функции клонирования голоса.

Разработчики отмечают, что при запуске потоковой версии аудиогенерации VibeVoice может быть интегрирована в чат-ассистенты, позволяя обходиться без внешних серверов. Дополнительные сведения, включая инструкции по установке и настройке, доступны в официальном репозитории VibeVoice в GitHub и на платформе Hugging Face.


window-new
Soft
Hard
Тренды 🔥
Wasabi купит у Seagate сервис облачного хранения Lyve Cloud 33 мин.
Экранизация Metal Gear Solid спустя 20 лет после анонса подала признаки жизни — фильм снимут режиссёры ужастика «Пункт назначения: Узы крови» 53 мин.
Mozilla раскритиковала Microsoft, которая навязывает ИИ Copilot 2 ч.
Qwen закрывается: Alibaba сосредоточится на переводе ИИ на коммерческие рельсы 2 ч.
Европа оштрафовала американских бигтехов на $7 млрд за два года и разозлила Трампа 2 ч.
OpenAI вслед за Anthropic объявила о создании мощнейшего ИИ, который опасно давать в руки всем подряд 2 ч.
Амбициозный китайский боевик Phantom Blade Zero создавался без применения генеративного ИИ — игра вышла на финишную прямую 2 ч.
Генпрокурор Флориды начал расследование против OpenAI из-за угроз безопасности 3 ч.
Пользователи Instagram теперь могут редактировать свои комментарии, но недолго 3 ч.
OpenAI представила тариф Pro за $100 в месяц для программистов 3 ч.
Bridge Data Centres выгнала из своих ЦОД сингапурское ИИ-неооблако Megaspeed, подозреваемое в нарушении антикитайских санкций США 44 мин.
SpaceX приступила к монтажу оборудования на своём предприятии по упаковке чипов в Техасе 50 мин.
Китайцы сами раскрыли схему завоза санкционных серверов с Nvidia H100 и H200 2 ч.
ИИ разогнал инвестиции в ЦОД до $770 млрд — больше, чем в нефть и газ 2 ч.
В России начались продажи планшета Infinix XPAD 30E с 11-дюймовым дисплеем и поддержкой 4G 3 ч.
Ulefone на выставке «Связь-2026»: защищённые смартфоны с тепловизорами, проектором и другие новинки 3 ч.
ИИ-бум не сдувается — квартальная выручка TSMC выросла на 35 % 3 ч.
Норвегия заказала первый флот морских электрических «маршруток» — паромов на подводных крыльях 3 ч.
Капитализация Intel взлетела до максимума за 25 лет на новостях о сделке с Tesla и SpaceX 3 ч.
Стали известны технические характеристики смартфона CMF Phone 3 Pro от Nothing 4 ч.