Сегодня 30 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии
Быстрый переход

Илону Маску придётся ответить в суде за преследование OpenAI

Около десяти лет назад Илон Маск (Elon Musk) принимал участие в становлении стартапа OpenAI, но покинул его до того, как успех ChatGPT стремительно нарастил коммерческий потенциал компании. Нынешнее руководство OpenAI считает, что сейчас Маск пытается навредить бизнесу компании всеми способами, попутно продвигая интересы конкурирующего стартапа xAI. Остановить Маска OpenAI попытается через суд.

 Источник изображения: Unsplash, Levart_Photographer

Источник изображения: Unsplash, Levart_Photographer

Соответствующий иск, как отмечает Bloomberg, был подан адвокатами OpenAI на этой неделе. В примерно стостраничном документе представители истца описывают, как Илон Маск использует судебные разбирательства и публикации в СМИ для ущемления интересов OpenAI. Даже февральскую попытку купить стартап за $97,4 млрд предприниматель использовал для нанесения ущерба его бизнесу, по словам адвокатов. Установив подобную планку стоимости, Маск тем самым усложнил переговоры OpenAI с реальными инвесторами, которые теперь неизбежно будут на неё ориентироваться и способны отказаться в результате от намерений вложить средства в капитал стартапа.

Основная цель подобной активности Маска, как считают представители OpenAI, заключается в формировании более выгодных условий для ведения бизнеса стартапа xAI, который он основал в 2023 году. Недавно xAI номинально поглотил социальную сеть X, которую Маск приобрёл в 2022 году за $44 млрд. Объединённая структура оценивается экспертами как минимум в $100 млрд.

На прошлой неделе OpenAI привлекала $40 млрд от японской корпорации SoftBank, с которой принимает участие в реализации проекта Stargate по развитию американской национальной вычислительной структуры. Данный раунд финансирования поднимает капитализацию OpenAI до $300 млрд, по мнению экспертов.

В иске OpenAI попутно сообщается о попытках Маска отговорить инвесторов от поддержки этой компании. Ранее Маск сам обвинял OpenAI в том, что со своих инвесторов компания берёт обещание не поддерживать конкурентов, но представители стартапа подобные обвинения отвергли. Судебное заседание по свежему иску должно будет рассматриваться при участии присяжных, как настаивают представители OpenAI. Сторонам в марте следующего года также предстоит встретиться в суде по иску о реструктуризации OpenAI, в котором миллиардер попытается её предотвратить. Когда состоится заседание по делу о преследовании OpenAI Илоном Маском, пока не сообщается.

Adobe внедрит креативных ИИ-агентов в Photoshop и Premiere Pro

Компания Adobe работает над внедрением ИИ-агентов в графический редактор Photoshop и видеоредактор Premiere Pro. Агенты смогут не только предложить варианты редактирования изображений и видео, но и автоматически применить их. Об этом сообщил в своём блоге Илай Гринфилд (Ely Greenfield), технический директор Adobe по цифровым медиа.

 Источник изображения: blog.adobe.com

Источник изображения: blog.adobe.com

В приложении Photoshop новый ИИ-агент, который получил название «креативный агент», будет доступен через новую плавающую панель Actions. Этот инструмент сможет анализировать изображение и предлагать правки, например, удаление лишних объектов на заднем плане или художественное размытие фона. Для применения изменений пользователю потребуется лишь подтвердить выбранный вариант, отмечает The Verge.

Хотя опытные пользователи Photoshop традиционно предпочитают вручную редактировать объекты, работать со слоями и вносить детализированные правки, Adobe начала внедрение ИИ-инструментов. Среди них — функция Generative Fill для заливки или дополнения пикселями изображения, и Distraction Removal для удаления лишних объектов.

В перспективе пользователи смогут давать агенту команды на естественном языке, что упростит освоение сложных операций (хотя ИИ сможет выполнять их и самостоятельно). При этом можно будет либо корректировать работу агента, либо редактировать как обычно слои вручную.

Что касается Premiere Pro, Adobe продолжает развивать недавно представленную технологию Media Intelligence. Она уже умеет анализировать видео и помогать в поиске нужных фрагментов. В будущем ИИ-агент сможет выполнять черновой монтаж по запросу пользователя.

«Хотя ИИ не заменит творческое видение человека, он способен предложить разумные идеи, которые ускорят работу над проектом, — отметил Гринфилд. — Кроме того, он научит выполнять сложные задачи в несколько кликов, способствуя профессиональному росту редактора». В дальнейшем агент для Premiere Pro сможет подбирать оптимальные кадры, корректировать цвет, настраивать звук и выполнять другие задачи, в том числе с применением недавно представленного инструмента Generative Extend, который автоматически добавляет несколько секунд к клипу для плавного перехода.

Технологию, лежащую в основе первого ИИ-агента для Photoshop, представят на мероприятии Adobe Max в Лондоне 24 апреля.

Главный конкурент ChatGPT запустил подписку за $200 в месяц, и в ней всё равно есть ограничения

Компания Anthropic собирается протестировать верхний ценовой порог премиальной подписки на своего чат-бота Claude. Компания станет очередным игроком — вслед за конкурентом OpenAI — на рынке искусственного интеллекта (ИИ), исследующим, сколько готовы платить пользователи за расширенный доступ к современным ИИ-технологиям.

 Источник изображения: Anthropic

Источник изображения: Anthropic

Сегодня Anthropic представила тариф Max, стоимость которого составила $100 или $200 в месяц в зависимости от объёма использования. По словам представителей компании, за $100 пользователи смогут отправлять в пять раз больше запросов к Claude, чем позволяет текущий план Pro за $18 в месяц. А за $200 возможности увеличатся в 20 раз. В настоящее время владельцы подписки Pro могут отправлять в среднем 45 сообщений боту в течение пяти часов.

Подобно другим разработчикам ИИ, компания из Сан-Франциско стремится убедить частных клиентов и бизнес приобретать её продукты, чтобы покрыть высокие затраты на разработку передовых ИИ-моделей. Новый тариф можно сравнить с предложением OpenAI, которая в конце прошлого года запустила аналогичную подписку за $200 в месяц для ChatGPT. Однако OpenAI предоставляет безлимитный доступ к самым мощным моделям за те же $200 в месяц.

Anthropic утверждает, что подписчики тарифа Max смогут получать более развёрнутые ответы, а их запросы будут обрабатываться в приоритетном порядке даже в периоды пиковых нагрузок. Кроме того, они получат эксклюзивный доступ к новым моделям и обновлениям программного обеспечения.

Последняя версия модели Anthropic — Claude 3.7 Sonnet — также предоставляет пользователям возможность выбора между быстрым ответом на простые запросы и более детальным, разложенным «по полочкам» и имитирующим человеческое мышление. Это выделяет компанию на фоне конкурентов в условиях насыщенного рынка ИИ, особенно после того как в марте Anthropic успешно привлекла $3,5 млрд инвестиций, достигнув оценки в $61,5 млрд и тем самым подтвердив своё место среди крупнейших ИИ-стартапов мира.

ИИ-помощник программиста Google Gemini Code Assist научился писать приложения по описанию и переводить код из одного языка в другой

На конференции Cloud Next представитель компании сообщил, что ИИ-помощник по кодированию Code Assist теперь умеет развёртывать новых ИИ-агентов. Они могут создавать приложения из спецификаций продуктов в Google Docs или выполнять преобразования кода с одного языка на другой. Code Assist теперь доступен в Android Studio в дополнение к другим средам программирования.

 Источник изображения: Google

Источник изображения: Google

Обновления Code Assist являются ответом на конкурентное давление со стороны таких компаний, как GitHub Copilot, Cursor и Cognition Labs, создателя вирусного инструмента программирования Devin. Рынок помощников по кодированию на основе искусственного интеллекта растёт с каждым месяцем, а его ёмкость оценивается в миллиарды долларов.

Агенты Code Assist, которыми можно управлять с новой доски Gemini Code Assist Kanban, могут создавать рабочие планы и отчитываться о пошаговом прогрессе по запросам на работу. Помимо создания программного обеспечения и миграции кода, агенты могут внедрять новые функции приложений, выполнять проверки кода и генерировать модульные тесты и документацию.

Пока трудно понять, насколько хорошо работают агенты Code Assist. Исследования показали, что даже лучшие генераторы кода на основе ИИ на сегодняшний день могут допускать ошибки и вносить уязвимости безопасности из-за неспособности понимать логику программирования. На одном из недавних тестов Devin успешно выполнил только три из двадцати задач.

Поэтому, при использовании любого ИИ-ассистента для программирования не помешает самостоятельно проверить получившийся код.

Google представила рассуждающую ИИ-модель Gemini 2.5 Flash с высокой производительностью и эффективностью

Google выпустила новую ИИ-модель, призванную обеспечить высокую производительность с упором на эффективность. Она называется Gemini 2.5 Flash и вскоре станет доступна в составе платформы Vertex AI облака Google Cloud для развёртывания и управления моделями искусственного интеллекта (ИИ).

 Источник изображения: Google

Источник изображения: Google

Компания отмечает, что Gemini 2.5 Flash предлагает «динамические и контролируемые» вычисления, позволяя разработчикам регулировать время обработки запроса в зависимости от их сложности.

«Вы можете настроить скорость, точность и баланс затрат для ваших конкретных нужд. Эта гибкость является ключом к оптимизации производительности Flash в высоконагруженных и чувствительных к затратам приложениях», — написала компания в своём официальном блоге.

На фоне растущей стоимости использования флагманских ИИ-моделей Gemini 2.5 Flash может оказаться крайней полезной. Более дешёвые и производительные модели, такие как 2.5 Flash, представляют собой привлекательную альтернативу дорогостоящим флагманским вариантам, но ценой потери некоторой точности.

Gemini 2.5 Flash — это «рассуждающая» модель по типу o3-mini от OpenAI и R1 от DeepSeek. Это означает, что для проверки фактов ей требуется немного больше времени, чтобы ответить на запросы. Google утверждает, что 2.5 Flash идеально подходит для работы с большими объёмами данных и использования в реальном времени, в частности, для таких задач, как обслуживание клиентов и анализ документов.

«Эта рабочая модель оптимизирована специально для низкой задержки и снижения затрат. Это идеальный движок для отзывчивых виртуальных помощников и инструментов резюмирования в реальном времени, где эффективность при масштабировании является ключевым фактором», — описывает новую ИИ-модель компания.

Google не опубликовала отчёт по безопасности или техническим характеристикам для Gemini 2.5 Flash, что усложнило задачу определения её преимуществ и недостатков. Ранее компания говорила, что не публикует отчёты для моделей, которые она считает экспериментальными.

Google также объявила, что с третьего квартала планирует интегрировать модели Gemini, такие как 2.5 Flash в локальные среды. Они будут доступны в Google Distributed Cloud (GDC), локальном решении Google для клиентов со строгими требованиями к управлению данными. В компании добавили, что работают с Nvidia над установкой Gemini на совместимые с GDC системы Nvidia Blackwell, которые клиенты смогут приобрести через Google или по своим каналам.

Европа решила стать «ИИ-континентом»: инфраструктуру будут развивать, а регулирование — ослаблять

Власти Евросоюза представили план, направленный на стимулирование местной отрасли искусственного интеллекта и её усиление в условиях жёсткой конкуренции с США и Китаем. Это потребовалось после того, как местные разработчики выступили с критикой в отношении действующих в регионе норм, связанных с ИИ.

 Источник изображения:  ALEXANDRE LALLEMAND / unsplash.com

Источник изображения: ALEXANDRE LALLEMAND / unsplash.com

В опубликованном Еврокомиссией документе говорится о «Плане действий ИИ-континента» (AI Continent Action Plan), направленном на «преобразование сильных традиционных отраслей Европы и её исключительного кадрового резерва в мощные двигатели инноваций и ускорения ИИ». Власти региона намереваются, в частности, поддержать местные проекты в области ИИ: построить сеть производств оборудования для ИИ, «гигафабрики» и открыть специализированные лаборатории, которые упростят стартапам доступ к высококачественным наборам данных для обучения ИИ. Эти «фабрики» европейские чиновники описывают как крупные объекты, в которых используется передовое оборудование для разработки и обучения моделей ИИ. Будет также сформирована служба, которая займётся правоприменением и поможет местным компаниям соблюдать требования местного «Закона об ИИ». О схожих намерениях ранее объявили власти Великобритании.

Пока европейские власти говорят о планах усилить присутствие региона на рынке ИИ, мировые технологические лидеры указывают, что европейское законодательство по всем аспектам от области ИИ до налогообложения препятствует инновациям и затрудняет работу местных стартапов. «Закон об ИИ» регулирует применение ИИ, исходя из рисков, которые технология представляет для общества — документ адаптировали, чтобы его можно было применять к разработчикам «основополагающих» моделей, к таким как OpenAI и французский стартап Mistral. Закон подвергался критике и со стороны властей США — они отметили, что европейские власти избрали неверные механизмы взаимодействия как с американскими технологическими компаниями, так и с местными стартапами.

В этой связи новая инициатива может предусматривать облегчение регуляторного бремени и ослабление барьеров для инноваций, отмечают опрошенные CNBC эксперты. Если проект поможет устранить моменты правовой неопределённости, связанные с толкованием европейского «Закона об ИИ», он имеет все шансы стать стимулом не только для местных разработчиков и пользователей систем ИИ, но и для компаний из США и Великобритании, потому что действие документа распространяется на все работающие в регионе системы ИИ вне зависимости от их происхождения.

Google представила свой самый мощный ИИ-процессор Ironwood — до 4,6 квадриллиона операций в секунду

В рамках конференции Cloud Next на этой неделе компания Google представила новый специализированный ИИ-чип Ironwood. Это уже седьмое поколение ИИ-процессоров компании и первый TPU, оптимизированный для инференса — работы уже обученных ИИ-моделей. Процессор будет использоваться в Google Cloud и поставляться в системах двух конфигураций: серверах из 256 таких процессоров и кластеров из 9216 таких чипов.

 Источник изображений: Google

Источник изображений: Google

«Ironwood — это наш самый мощный, самый производительный и самый энергоэффективный TPU. Он разработан для ускорения инференса ИИ-моделей в масштабах облачной инфраструктуры», — прокомментировал анонс процессора вице-президент Google Cloud Амин Вахдат (Amin Vahdat).

Анонс Ironwood состоялся на фоне усиливающейся конкуренции в сегменте разработок проприетарных ИИ-ускорителей. Хотя Nvidia доминирует на этом рынке, свои технологические решения также продвигают Amazon и Microsoft. Первая разработала ИИ-процессоры Trainium, Inferentia и Graviton, которые используются в её облачной инфраструктуре AWS, а Microsoft применяет собственные ИИ-чипы Cobalt 100 в облачных инстансах Azure.

Google заявляет, что Ironwood обладает пиковой вычислительной производительностью 4614 Тфлопс или 4614 триллионов операций в секунду. Таким образом кластер из 9216 таких чипов предложит производительность в 42,5 Экзафлопс.

Каждый процессор оснащён 192 Гбайт выделенной оперативной памяти с пропускной способностью 7,4 Тбит/с. Также чип включает усовершенствованное специализированное ядро ​​SparseCore для обработки типов данных, распространённых в рабочих нагрузках «расширенного ранжирования» и «рекомендательных систем» (например, алгоритм, предлагающий одежду, которая может вам понравиться). Архитектура TPU оптимизирована для минимизации перемещения данных и задержек, что, по утверждению Google, приводит к значительной экономии энергии.

Компания планирует использовать Ironwood в своём модульном вычислительном кластере AI Hypercomputer в составе Google Cloud.

Джон Кармак встал на защиту ИИ-версии Quake II, которую игроки назвали «абсолютно отвратительной»

Представленная на днях демоверсия культового шутера Quake II на базе ИИ-модели Muse от Microsoft вызвала отторжение у игроков, тогда как сооснователь id Software и соавтор Quake Джон Кармак (John Carmack) увидел в технологии большой потенциал.

 Источник изображения: id Software

Источник изображения: id Software

Демонстрация ИИ-версии Quake II была встречена в основном негативно. Пользователь Quake Dad в X, например, назвал проект «абсолютно отвратительным» и приравнял его к «плевку на труд всех разработчиков в мире».

Отвечая Quake Dad, Кармак не согласился с высказанной пользователем позицией и заявил, что «создание мощных инструментов является ключевым двигателем прогресса в компьютерной сфере».

Кармак вспомнил, как при разработке своих первых проектов вручную делал то, за что сегодня отвечают игровые движки: «Прогресс в программном обеспечении сделал эту работу такой же ненужной, как обслуживание колёс у боевой колесницы».

 Источник изображения: ArsTechnica (Benj Edwards)

Источник изображения: ArsTechnica (Benj Edwards)

По мнению Кармака, ИИ-инструменты «позволят лучшим достигать ещё более впечатляющих высот, дадут возможность небольшим командам добиваться большего и привлекут кардинально новую демографию творцов».

«Да, прогресс дойдёт до того, что вы сможете получить интерактивную игру (роман или фильм) из текстового запроса, но куда более выдающиеся произведения всё равно будут создавать команды увлечённых разработчиков», — заверил Кармак.

Разработчика поддержал гендиректор Epic Games Тим Суини (Tim Sweeney), который призывает не бояться автоматизации и считает, что конкуренция вынудит компании использовать ИИ-инструменты для создания наилучших продуктов.

Amazon представила голосовую ИИ-модель Nova Sonic

Amazon представила модель генеративного искусственного интеллекта Nova Sonic, способную обрабатывать голос и генерировать речь, которая звучит естественно. В тестах на замеры скорости, распознавание речи и качество разговора Sonic зарекомендовала себя как конкурентоспособная в сравнении с передовыми голосовыми моделями OpenAI и Google.

 Источник изображений: aboutamazon.com

Источник изображений: aboutamazon.com

Nova Sonic — ответ Amazon на новые голосовые модели ИИ, такие как лежащая в основе звукового режима ChatGPT; все они предлагают более естественные форматы общения, чем ранние версии голосового помощника Alexa. Технологические прорывы последних лет позволили сделать устаревшие модели и цифровых помощников, включая Alexa и Apple Siri, намного более естественными во взаимодействии с человеком. Модель Nova Sonic доступна через Bedrock — предлагаемую Amazon платформу для разработчиков корпоративных приложений с ИИ; поддерживается двунаправленный потоковый API. Nova Sonic, добавили в Amazon, обходится в эксплуатации на 80 % дешевле, чем мультимодальная OpenAI GPT-4o, а её компоненты уже работают в обновлённом варианте Alexa+.

Она превосходит конкурентов в маршрутизации пользовательских запросов к различным API — модель «знает», когда ей необходимо в реальном времени извлечь информацию из интернета, проанализировать собственный источник данных или выполнить действие во внешнем приложении — и использовать для этого соответствующий инструмент. Во время двустороннего диалога Nova Sonic ждёт, чтобы заговорить «в подходящее время», учитывая свойственные собеседнику паузы и запинки. Она также составляет текстовую расшифровку речи пользователя, которую разработчики могут использовать для различных приложений.

 Источник изображений: aboutamazon.com

В задачах, связанных с распознаванием речи, она менее склонна к ошибкам, чем другие голосовые модели ИИ, то есть относительно хорошо понимает пользователя, даже если он бормочет, говорит с ошибками или находится в шумной обстановке. В эталонном тесте Multilingual LibriSpeech, позволяющем оценить качество распознавания речи на разных языках и диалектах, Nova Sonic показала коэффициент ошибок в словах (WER) всего 4,2 % в среднем по английскому, французскому, итальянскому, немецкому, и испанскому языках. То есть при подготовке расшифровки речи она неверно распознает примерно четыре из ста слов по сравнению с человеком.

В бенчмарке Augmented Multi Party Interaction, оценивающем качество разговора вслух с несколькими участниками, Nova Sonic оказалась на 46,7 % точнее по критерию WER, чем OpenAI GPT-4o-transcribe. Модель от Amazon также оказалась очень быстрой — её средняя задержка составила 1,09 с против 1,18 с, которую показала GPT-4o, лежащая в основе OpenAI Realtime API. Компания намеревается представить ещё несколько моделей ИИ, способных к обработке изображений, видео, голоса и «других сенсорных данных, которые необходимы при переносе в физический мир».

Alibaba обновила ассортимент ИИ-моделей Qwen для пользователей по всему миру

Облачное подразделение Alibaba Group Holding обновило ассортимент доступных вне Китая продуктов на основе искусственного интеллекта в стремлении привлечь новых клиентов из стран по всему миру.

 Источник изображения: alibabagroup.com

Источник изображения: alibabagroup.com

Alibaba Cloud расширило возможности PaaS (платформы как услуги) и усилила линейку ИИ-продуктов новыми предложениями: большой языковой моделью Qwen-Max и рассуждающей QwQ-Plus, похожей на DeepSeek R1. Расширение присутствия в Сингапуре свидетельствует, что Alibaba наращивает кампанию по привлечению пользователей и разработчиков ИИ как внутри Китая, так и за его пределами.

С момента выхода DeepSeek в январе китайский гигант в области электронной коммерции и облачных вычислений ускорил циклы разработки и выпуска ИИ-продуктов. В их число вошли, в частности, инструменты бизнес-аналитики для разработчиков, работа с которыми для частных лиц стоит всего $1 в год. DeepSeek заставила всю китайскую отрасль ИИ наводнить рынок недорогими, а то и вовсе бесплатными сервисами.

Уже в апреле Alibaba намеревается выпустить ещё одно крупное обновление — флагманскую модель Qwen 3. Ранее компания представила новую версию ИИ-помощника Quark AI, включающую возможности чат-бота, функции рассуждений и выполнения задач. Помимо облачных сервисов, направленных на привлечение разработчиков приложений с ИИ на свою платформу, компания представила новый набор продуктов класса SaaS (ПО как услуга). В их число вошли средство анализа документов AI Doc и Smart Studio — инструмент для создания контента с помощью генеративного ИИ.

Google вскоре выпустит отдельное приложение для одного из самых мощных ИИ-инструментов

Вскоре выйдет мобильная версия ИИ-блокнота NotebookLM компании Google на нейросети Gemini Pro, который в настоящее время доступен только для пользователей десктопов. Сообщение об этом появилось в официальном аккаунте продукта на платформе X.

 Источник изображения: Google

Источник изображения: Google

NotebookLM может обрабатывать большие объёмы информации, делая на основе этого обобщения в стиле подкаста, в виде руководства или учебного пособия. Эти функции могут быть полезны не только научным сотрудникам, но и обычным пользователям, избавляя их, например, от чтения руководств по продуктам, поскольку у NotebookLM будут готовы ответы на все вопросы по этому поводу на основе загруженной информации.

Если вы проходите обучение на каких-либо курсах или готовитесь к экзамену, NotebookLM от Google поможет вам в этом. Например, можно будет загрузить имеющиеся учебные материалы, благо функциональность NotebookLM позволяет находить в интернете и добавлять онлайн-источники в блокнот, и объединить их в одно учебное пособие для повторения, создать на их основе базу знаний и многое другое.

NotebookLM также предложит краткое описание содержимого документа, выделив ключевые моменты, поможет написать сценарий видеоклипа на основе идеи и т. д.

Как отметил ресурс Android Authority, Google распространяет функциональность NotebookLM на свои другие продукты. Например, компания добавила в Gemini функцию аудиопересказа Audio Overview из NotebookLM, позволяющую преобразовывать документы и слайды в аудиодискуссии в стиле подкаста.

Google платит сотрудникам отделов ИИ за ничегонеделание — лишь бы они не ушли к конкурентам

В условиях жёсткой конкуренции Google вынуждена целый год выплачивать некоторым специалистам по искусственному интеллекту средства за то, чтобы они ничего не делали — лишь бы удержать их от перехода в другие компании, сообщил Business Insider.

 Источник изображения: Silicon Valley,  HBO

Источник изображения: Silicon Valley, HBO

Специализирующееся на ИИ подразделение Google DeepMind заключает с некоторыми своими сотрудниками в Великобритании «жёсткие» соглашения о неконкуренции, которые не позволяют им в течение года переходить на работу в компании того же профиля. Некоторым из них в течение указанного времени производят выплаты, что равнозначно длительному неоплачиваемому отпуску. Но в результате этих действий исследователи рискуют утратить актуальные знания, умения и навыки, поскольку прогресс в отрасли ИИ отличается быстрыми темпами.

В прошлом году Федеральная торговая комиссия (FTC) США запретила заключать большинство соглашений о неконкуренции, но к лондонской штаб-квартире DeepMind это не относится. В марте вице-президент Microsoft по ИИ Нандо де Фрейтас (Nando de Freitas) рассказал, что некоторые сотрудники DeepMind «в отчаянии» обращаются к нему, потому что не могут преодолеть силу соглашений о неконкуренции, и призвал не заключать их. Такая практика применяется «избирательно», уточнили в Google.

Amazon представила ИИ-модель Nova Reel 1.1 для генерации двухминутных видео по текстовым подсказкам

Amazon представила обновлённую ИИ-модель Nova Reel 1.1, позволяющую генерировать видео продолжительностью до двух минут на основе текстовых подсказок пользователей. Её предыдущая версия Nova Reel была анонсирована в декабре 2024 года, став первой попыткой компании выйти на рынок моделей для создания видео с помощью генеративного ИИ.

 Источник изображения: Amazon

Источник изображения: Amazon

Nova Reel 1.1, может генерировать «многокадровые» видео с «единым стилем» между кадрами, сообщила в блоге разработчик-адвокат AWS Элизабет Фуэнтес (Elizabeth Fuentes). Пользователи могут предоставить текстовую подсказку длиной до 4000 символов для генерации двухминутного видео, состоящего из шестисекундных кадров.

Обновлённая модель также получила новый режим под названием «Ручной многокадровый» (Multishot Manual). В этом режиме модель может использовать изображение вместе с подсказкой, чтобы обеспечить лучшее соответствие запросу композиции видеокадра. По словам Фуэнтес, при наличии изображения с разрешением 1280 × 720 пикселей и подсказки с максимальным количеством символов 512 модель может генерировать видео, содержащие до 20 кадров.

Модели Nova Reel доступны только на платформах и в сервисах AWS, включая Bedrock — набор инструментов для разработки ИИ компании. При этом клиенты должны запросить доступ к ним.

Модели, генерирующие видео, обучаются на огромном количестве образцов видео, необходимых для «изучения» закономерностей для создания новых клипов. Некоторые компании обучают модели на видео, защищённых авторским правом без получения на это разрешения от владельцев или авторов. В результате эти модели могут «выдать» защищённые авторским правом кадры, подвергая пользователей моделей опасности судебного иска в связи нарушением прав на интеллектуальную собственность.

Amazon не раскрыла источник данных для обучения Nova Reel, но пообещала, что будет защищать клиентов AWS в случае их обвинения в нарушении авторских прав в соответствии со своей политикой возмещения ущерба.

В Meta✴ отрицают, что искусственно завысили результаты тестов ИИ-модели Llama 4

Представитель Meta опроверг слухи о том, что компания намеренно улучшала показатели своих новых ИИ-моделей Llama 4 в бенчмарках. Вице-президент по генеративному искусственному интеллекту Ахмад Аль-Дахле (Ahmad Al-Dahle) заявил в посте на страницах X, что утверждения о подгонке результатов с целью сокрытия слабых сторон моделей Maverick и Scout — «просто неправда».

 Источник изображения: Mariia Shalabaieva / Unsplash

Источник изображения: Mariia Shalabaieva / Unsplash

Слухи о манипуляциях появились в соцсетях после публикации бывшего сотрудника Meta. Пользователь китайской платформы утверждал, что уволился из компании в знак протеста против «нечестных методов тестирования». Позже эти обвинения распространились в X (бывший Twitter) и Reddit, пишет издание TechCrunch.

Однако Аль-Дахле подчеркнул, что Meta не обучала модели Llama 4 Maverick и Llama 4 Scout на «тестовых наборах данных», то есть специальных выборках, используемых для оценки ИИ. Такая практика могла бы искусственно завысить результаты, создав ложное впечатление о возможностях моделей.

Подозрения изначально появились из-за различий в работе Llama 4 Maverick на разных платформах. Исследователи заметили, что версия модели в бенчмарке LM Arena ведёт себя иначе, чем публично доступная и не справляется с определёнными задачами. Кроме того, Meta использовала экспериментальную сборку Maverick для улучшения результатов тестов, что также вызвало вопросы.

Одновременно Аль-Дахле отмечает, что причина, по которой пользователи пока сталкиваются с нестабильным качеством моделей, может быть связана с настройками облачных провайдеров, на серверах которых размещаются скрипты. «Мы выпустили модели сразу после их готовности, и потребуется несколько дней, чтобы все публичные реализации были настроены в соответствии с нашими требованиями», — пояснил он. В Meta пообещали в любом случае продолжить работу над исправлениями багов Llama 4 для быстрой интеграции разработчиками в свои проекты.

«ИИ крадёт у всех»: медиаиндустрия потребовала немедленно остановить воровство контента для ИИ

Сотни медиакомпаний, включая The New York Times, The Washington Post и The Guardian, запустили рекламную кампанию с призывом к правительству США защитить контент от неконтролируемого использования искусственным интеллектом (ИИ), сообщает The Verge. Инициатива под названием Support Responsible AI организована ассоциацией News/Media Alliance и включает объявления как в печатных, так и онлайн-изданиях.

 Источник изображения: сгенерировано AI

Источник изображения: сгенерировано AI

Кампания стартовала через несколько недель после того, как OpenAI и Google направили властям письма с просьбой разрешить их ИИ-моделям обучаться на защищённых авторским правом материалах. В рекламе используются такие слоганы, как «Следите за ИИ», «Остановите кражу ИИ», «ИИ крадёт у вас тоже», и всё это вместе с призывом внизу каждого тизера: «Кража — это не по-американски. Скажите Вашингтону, чтобы техногиганты платили за контент, который они берут у издателей».

Объявления содержат ссылку и QR-код, ведущие на сайт Support Responsible AI, где пользователей призывают обратиться к своим представителям в Конгрессе с требованием обязать технологические компании справедливо компенсировать труд журналистов, писателей и художников. Также издатели настаивают на обязательном указании источников в контенте, созданном ИИ.

 Источник изображения: News/Media Alliance

Источник изображения: News/Media Alliance

«Сейчас Big Tech и ИИ-компании используют контент издателей против них самих, то есть забирают его без разрешения и оплаты, чтобы обучать ИИ-модели, которые в конечном итоге перетягивают на себя все рекламные доходы от создателей, — заявила Даниэль Коффи (Danielle Coffey), президент и генеральный директор News/Media Alliance. — Медиаиндустрия не против ИИ — многие компании сами используют эти инструменты. Но мы хотим сбалансированной экосистемы, где ИИ развивается ответственно».

В феврале аналогичную кампанию провели крупные британские газеты, разместив на первых полосах лозунг «Make It Fair» с призывом защитить авторские права от обучения ИИ-моделей. Среди участников сегодняшней инициативы также присутствуют The Atlantic, Seattle Times, Tampa Bay Times, Condé Nast (издатель Wired) и Axel Springer (владелец Politico).

Очевидно, что конфликт между медиакомпаниями и технологическими гигантами обостряется. Пока OpenAI и Google добиваются у правительства США свободного доступа к данным для обучения ИИ, издатели настаивают на законодательном регулировании и выплатах за использование их материалов. Исход этой борьбы в эпоху нейросетей может определить будущее цифрового контента .


window-new
Soft
Hard
Тренды 🔥
Российский суд оштрафовал заблокированный Viber на 800 тысяч рублей 18 мин.
Больше половины запущенных с 2021 года криптовалют провалились 2 ч.
«Горячие» обновления для локальных Windows Server 2025 станут платными 4 ч.
Актриса озвучки Йеннифэр из The Witcher 3: Wild Hunt «ничего не знает» о возможном возвращении чародейки в «Ведьмаке 4» 4 ч.
Доминирование Google пошатнулось — его доля на мировом рынке поиска скатилась ниже 90 % впервые за десять лет 5 ч.
Intel раскрыла потенциал встроенной графики Core Ultra 200V — свежий драйвер повысил FPS на 10 % и не только 5 ч.
«Яндекс Маркет» обзавёлся чат-ботом на мощнейшем ИИ «Яндекса» — он поможет выбрать покупки 6 ч.
Футуристический шутер La Quimera от бывших разработчиков Metro пройдёт через ранний доступ Steam, чтобы стать «большой и цельной» игрой 6 ч.
Уже 30 % программного кода Microsoft написано искусственным интеллектом, а не людьми 6 ч.
Xiaomi выпустила открытую рассуждающую ИИ-модель MiMo и заявила, что она быстрее OpenAI o1-mini 6 ч.