Сегодня 02 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Stability AI выпустила ИИ-генератор музыки, который быстро работает даже на смартфоне

Stability AI, разработчик популярной нейросети Stable Diffusion, представила музыкальную ИИ-модель Stable Audio Open Small, которая генерирует аудио в стереозвучании и способна работать на смартфонах без подключения к интернету. Модель создана совместно с производителем чипов Arm, чьи процессоры используются в большинстве мобильных устройств, и способна быстро генерировать аудио в высоком качестве даже на устройствах с ограниченными вычислительными ресурсами.

 Источник изображения: AI

Источник изображения: AI

В отличие от конкурентов, таких как Suno и Udio, которым требуется облачная обработка, Stable Audio Open Small работает локально. При этом, как отмечает TechCrunch, обучение модели проводилось только на данных из бесплатных аудиобиблиотек Free Music Archive и Freesound, что снижает риски нарушения авторских прав и выгодно отличает её от некоторых других ИИ-сервисов, использующих защищённый контент.

Модель содержит 341 миллион параметров и оптимизирована для процессоров Arm. Она предназначена для быстрого создания коротких аудиосэмплов и звуковых эффектов, например, ударных или инструментальных партий. По заявлению Stability AI, на смартфоне ИИ может сгенерировать 11-секундное аудио менее чем за восемь секунд.

Одновременно у Stable Audio Open Small есть некоторые ограничения. Например, она понимает текстовые запросы только на английском языке, не умеет создавать реалистичный вокал или сложные музыкальные композиции. Кроме того, компания признаёт, что из-за того, что модель обучалась на западно-ориентированных данных, она лучше справляется со стилями, присущими западной музыке.

Ещё одна сложность заключается в условиях использования. Для исследователей, любителей и малого бизнеса ИИ-модель доступна бесплатно, но если годовой доход компании превышает $1 млн, потребуется покупка коммерческой лицензии. И хотя для инди-разработчиков такие условия выгодны, для крупных проектов это может стать определённой сложностью.

Напомним, Stability AI, известная по своей модели глубокого обучения Stable Diffusion, генерирующей изображения по текстовым описаниям, в последние месяцы пытается восстановить репутацию после финансовых проблем при бывшем генеральном директоре Эмаде Мостаке (Emad Mostaque). Компания привлекла инвестиции, назначила нового главу и добавила в совет директоров режиссёра Джеймса Кэмерона (James Cameron). Параллельно она продолжает выпускать новые генеративные модели, включая новые инструменты для создания изображений.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Не Hollow Knight: Silksong единой — Microsoft рассказала о первых новинках Game Pass в сентябре 21 мин.
Представлен Dolby Vision 2 — «кинематографический» HDR, аутентичное сглаживание и ИИ-оптимизации 36 мин.
Квантовые компьютеры ещё не готовы, но в ПО для них уже инвестируют миллионы 43 мин.
Слухи: Ubisoft начала строить планы на Rayman 4, а Beyond Good and Evil 2 выйдет до конца 2027 года 2 ч.
Спустя почти год Capcom удалила Denuvo из Dead Rising Deluxe Remaster, но заменила её другой DRM 3 ч.
Не хочешь — заставим: правительство само определит категории объектов КИИ 4 ч.
Криптовалюта WLFI Дональда Трампа упала в цене в первый же день торгов 6 ч.
GeForce RTX 4060 стала самой популярной видеокартой в Steam, а доля Windows 11 впервые превысила 60 % 7 ч.
7 из 10 человек теперь заходят в интернет через Google Chrome — Edge и Safari сильно отстают 8 ч.
YouTube начал блокировать семейные Premium-подписки, если их участники не живут вместе 8 ч.
Tesla провалила старт продаж в Индии — всего 600 заказов за 2,5 месяца 31 мин.
Передовые чипы подорожают: TSMC повысит цены на 10 % из-за трамповских пошлин 2 ч.
Одна плата ASRock уничтожила два Ryzen 7 9800X3D всего за несколько месяцев 2 ч.
В небо над Россией запустят воздушные шары с 5G — альтернатива спутникам Starlink 3 ч.
Мировые продажи электромобилей выросли на 29 % и перевалят за 20 млн в этом году 3 ч.
В умном доме «Сбера» поселился GigaChat — ИИ прокачал голосовое управления и не только 3 ч.
«Не понадобится ни один человек»: доступные роботы позволят Китаю и дальше заваливать мир дешёвыми товарами 3 ч.
Революция в мире оптической связи: Microsoft помогла улучшить характеристики полого оптоволокна 3 ч.
Tecno представила сверхтонкие смартфоны Spark Slim и Pova Slim — меньше 6 мм, но больше 5000 мА·ч 4 ч.
Российский NGFW уровня Enterprise: UserGate выпустила Data Center Firewall для защиты ЦОД и крупных организаций 4 ч.