Сегодня 15 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии-сервис

Stability AI выпустила ИИ-генератор музыки, который быстро работает даже на смартфоне

Stability AI, разработчик популярной нейросети Stable Diffusion, представила музыкальную ИИ-модель Stable Audio Open Small, которая генерирует аудио в стереозвучании и способна работать на смартфонах без подключения к интернету. Модель создана совместно с производителем чипов Arm, чьи процессоры используются в большинстве мобильных устройств, и способна быстро генерировать аудио в высоком качестве даже на устройствах с ограниченными вычислительными ресурсами.

 Источник изображения: AI

Источник изображения: AI

В отличие от конкурентов, таких как Suno и Udio, которым требуется облачная обработка, Stable Audio Open Small работает локально. При этом, как отмечает TechCrunch, обучение модели проводилось только на данных из бесплатных аудиобиблиотек Free Music Archive и Freesound, что снижает риски нарушения авторских прав и выгодно отличает её от некоторых других ИИ-сервисов, использующих защищённый контент.

Модель содержит 341 миллион параметров и оптимизирована для процессоров Arm. Она предназначена для быстрого создания коротких аудиосэмплов и звуковых эффектов, например, ударных или инструментальных партий. По заявлению Stability AI, на смартфоне ИИ может сгенерировать 11-секундное аудио менее чем за восемь секунд.

Одновременно у Stable Audio Open Small есть некоторые ограничения. Например, она понимает текстовые запросы только на английском языке, не умеет создавать реалистичный вокал или сложные музыкальные композиции. Кроме того, компания признаёт, что из-за того, что модель обучалась на западно-ориентированных данных, она лучше справляется со стилями, присущими западной музыке.

Ещё одна сложность заключается в условиях использования. Для исследователей, любителей и малого бизнеса ИИ-модель доступна бесплатно, но если годовой доход компании превышает $1 млн, потребуется покупка коммерческой лицензии. И хотя для инди-разработчиков такие условия выгодны, для крупных проектов это может стать определённой сложностью.

Напомним, Stability AI, известная по своей модели глубокого обучения Stable Diffusion, генерирующей изображения по текстовым описаниям, в последние месяцы пытается восстановить репутацию после финансовых проблем при бывшем генеральном директоре Эмаде Мостаке (Emad Mostaque). Компания привлекла инвестиции, назначила нового главу и добавила в совет директоров режиссёра Джеймса Кэмерона (James Cameron). Параллельно она продолжает выпускать новые генеративные модели, включая новые инструменты для создания изображений.

Новая статья: Лучшие ИИ-сервисы по версии 3DNews на начало 2025 г., часть 3: конструкторы приложений, секретари, менеджеры проектов, дата-дирижёры

Данные берутся из публикации Лучшие ИИ-сервисы по версии 3DNews на начало 2025 г., часть 3: конструкторы приложений, секретари, менеджеры проектов, дата-дирижёры

Amazon собралась бросить вызов OpenAI, Google и Anthropic, и готовит собственную рассуждающую ИИ-модель

Amazon разрабатывает новую модель искусственного интеллекта (ИИ) с продвинутыми возможностями рассуждения. Модель разрабатывается в рамках бренда Nova и может составить серьёзную конкуренцию основным игрокам рынка — OpenAI, Anthropic и Gemini.

 Источник изображения: Christian Wiediger / Unsplash

Источник изображения: Christian Wiediger / Unsplash

Как сообщает Business Insider, ссылаясь на источник, знакомый с проектом, Nova будет использовать гибридный подход к рассуждению, сочетая в одной системе быстрые ответы и более сложное, многозадачное мышление. Одной из ключевых задач Amazon является снижение стоимости работы модели по сравнению с конкурентами, такими как OpenAI o1, Anthropic Claude 3.7 Sonnet и Google Gemini 2.0 Flash Thinking. Ранее компания заявляла, что её текущие, не рассуждающие модели Nova, на 75 % дешевле сторонних предложений, доступных через платформу Bedrock AI.

За разработку Nova отвечает команда AGI под руководством главного научного сотрудника Рохита Прадаса (Rohit Prasad), а чтобы вывести модель в топ-5 по производительности, Amazon тестирует её на внешних бенчмарках, оценивающих навыки программирования и математики, включая SWE, Berkeley Function Calling Leaderboard и AIME.

Стоит сказать, что ИИ-модели с функцией рассуждения постепенно становятся новым этапом развития искусственного интеллекта. И хоть они работают медленнее, способны решать более сложные задачи, используя поиск решений и метод цепочки мыслей. Подобные технологии уже представили Google, OpenAI и Anthropic. Также китайская компания DeepSeek привлекла к себе внимание благодаря тому, что нашла ещё более эффективный подход.

Ожидается, что Nova усилит конкуренцию Amazon с продуктами Anthropic, недавно выпустившей модель Claude 3.7 Sonnet, которая также использует гибридный подход. Представители Amazon пока отказались от каких-либо комментариев, однако предположительно рассуждающая ИИ-модель может быть запущена уже к июню.

Новая статья: Лучшие ИИ-сервисы по версии 3DNews на начало 2025 г., часть 2: поболтать, задизайнить, сгенерировать текст и озвучить его

Данные берутся из публикации Лучшие ИИ-сервисы по версии 3DNews на начало 2025 г., часть 2: поболтать, задизайнить, сгенерировать текст и озвучить его

Новая статья: Лучшие ИИ-сервисы по версии 3DNews. Часть 1: ИИ-собеседники, генераторы картинок и видео, поисковики

Данные берутся из публикации Лучшие ИИ-сервисы по версии 3DNews. Часть 1: ИИ-собеседники, генераторы картинок и видео, поисковики


window-new
Soft
Hard
Тренды 🔥
Google представила ИИ-систему AlphaEvolve, которая отлично создаёт и оптимизирует алгоритмы — она ускорит обучение других ИИ 6 ч.
Stability AI выпустила ИИ-генератор музыки, который быстро работает даже на смартфоне 6 ч.
Релиз окончательного издания Mortal Kombat 1 возмутил фанатов — игру обещали поддерживать годами 7 ч.
«Достойна получить ремастер»: бывший технический директор Rockstar прокомментировал слухи о переиздании GTA IV 9 ч.
Улучшенная графика, бесшовный мир и быстрые загрузки: Nintendo показала сравнение Hogwarts Legacy на Switch и Switch 2 10 ч.
GSC анонсировала улучшенный сборник S.T.A.L.K.E.R. Legends of the Zone Trilogy для ПК и консолей — дата выхода, бесплатный апгрейд и системные требования 11 ч.
«Яндекс Маркет» внедрил ИИ для превентивного выявления мошенничества 12 ч.
«Нас разорили»: сайты сравнения цен потребовали от Google компенсации на €12 млрд 13 ч.
Слухи: хакер украл данные 89 миллионов пользователей Steam и выставил их на продажу 13 ч.
Apple представила ИИ, который создаёт 3D-объекты и сцены всего из трёх фото 15 ч.
Intel Foundry выйдет на безубыточность в 2027 году при помощи техпроцесса 14A 12 мин.
Флагманские смартфоны Realme GT 7 дебютируют на глобальном рынке 27 мая 6 ч.
США отменили спорные ограничения на экспорт ИИ-ускорителей в другие страны, но запретили им покупать ускорители Huawei 6 ч.
Samsung высмеяла толстые и тяжёлые iPhone в рекламе Galaxy S25 Edge 9 ч.
Раскрыты характеристики аппаратной платформы Nintendo Switch 2: низкие частоты и медленная память 9 ч.
AMD прозрачно намекнула на анонс Radeon RX 9060 XT через неделю 9 ч.
LG показала растягивающиеся, скручивающиеся и прозрачные дисплеи для автомобилей 9 ч.
MediaTek представила платформу Dimensity 9400e для доступных флагманов — она очень похожа на Dimensity 9300+ 9 ч.
Экс-главу китайского производителя чипов приговорили к смертной казни за коррупцию и хищение 11 ч.
$2849 за идеальный сон: Eight Sleep представила умную постель, которая борется с храпом и регулирует температуру 11 ч.