Сегодня 04 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → сервис
Быстрый переход

«Яндекс» обновил «Нейроэксперта» — ИИ научился рассуждать и анализировать сайты целиком

Компания «Яндекс» представила обновлённый сервис «Нейроэксперт». Он анализирует информацию на сайтах, в документах и файлах, создаёт базу знаний и находит в ней ответ на любой вопрос. Теперь сервис умеет рассуждать, изучает информацию на всём сайте по ссылке, лучше анализирует диаграммы и графики, а также поддерживает совместную работу.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

В режиме рассуждений «Нейроэксперт» обрабатывает большой объем данных, анализирует информацию, выстраивает логическую цепочку, обосновывает свои тезисы и только после этого отвечает на запрос пользователя. Ход мысли сервиса можно проследить, чтобы понять логику ответа и при необходимости скорректировать запрос.

«Можно спросить „Нейроэксперта“, почему уменьшилась доля рынка компании в определённом сегменте, и попросить, чтобы он предложил варианты, как это исправить. Сервис даст ответ, опираясь на предоставленную информацию — к примеру, на данные с сайта компании, из её публичных новостей и финансовых отчётов», — пояснили в «Яндексе»

Также теперь в поисках нужной информации можно попросить «Нейроэксперта» проанализировать все сведения на сайте, а не отдельные страницы. «Например, сервису можно дать ссылку на сайт компании и попросить найти упоминания ESG-стратегии в публичных материалах. „Нейроэксперт“ всё автоматически проанализирует, в том числе разделы „О компании“, „Новости“, „Отчёты“, и покажет подходящие упоминания на разных страницах», — привел пример «Яндекс».

Кроме того, сервис научился анализировать графики и диаграммы не только в файлах PPTX, но также в PDF и DOCX. «Нейроэксперт» даже может выводить формулы и математические символы вроде дробей, корня, возведения в квадрат и т.д.

В рамках совместной работы теперь для проекта можно задать уровни доступа и роли пользователей. Проект может быть закрытым (его видит только автор), частично доступным (можно поделиться по электронной почте) или публичным (видят все, у кого есть ссылка). Роль редактора предусматривает полное управление проектом, тогда как участник может только смотреть и задавать вопросы.

В «Нейроэксперта» можно загружать ссылки из интернета, документы, таблицы, презентации, аудио- и видеофайлы. Из них сервис создает базу знаний и на основе полученной информации отвечает на пользовательские вопросы. Услуга доступна всем пользователям. В «Яндексе» отметили, что ежемесячно «Нейроэкспертом» пользуются 350 тыс. человек, а самыми популярными темами запросов являются образование (17,6 %), юриспруденция (10,6 %), финансы (7 %), история (4,6 %), маркетинг (4,2 %), HR (3,8 %).

Apple собиралась создать конкурента AWS и Azure, но облачный проект ACDC завис в воздухе

Apple изучала возможность запуска собственных облачных сервисов для разработчиков, чтобы составить конкуренцию крупнейшим игрокам на этом рынке и обеспечить себе новый источник дохода, выяснил ресурс The Information. Текущий статус проекта неизвестен.

 Источник изображения: apple.com

Источник изображения: apple.com

Проекту присвоили название ACDC (Apple Chips in Data Centers), его концепция схожа с Amazon Web Services, Microsoft Azure и Google Cloud. Apple решила развить успех, которым обернулась её разработка собственных процессоров для мобильных устройств и ПК — они получили преимущество перед продукцией конкурентов, а чипы составили основу для запуска сервисов искусственного интеллекта в центрах обработки данных компании. В течение нескольких лет Apple рассматривала возможность расширить это направление до масштабов общедоступной платформы — недорогой и эффективной альтернативы конкурентам в области облачных технологий.

Процессоры Apple, по мнению руководства компании, способны предложить высокую производительность инференса (вывода) ИИ по более низкой цене. Задача становится всё более актуальной по мере роста спроса на эффективные и масштабные нагрузки ИИ. Компания стала использовать собственные процессоры в ЦОД, запустив платформу Private Cloud Compute, которая отвечает за серверную обработку запросов для службы Apple Intelligence; впоследствии к этой службе компания подключила направление Siri. Вскоре серверная обработка данных стала использоваться, чтобы повысить производительность функции поиска в приложениях «Фото» и Apple Music. Изучалась возможность открыть к этим ресурсам доступ для сторонних разработчиков — при реализации инициативы можно было не вмешиваться в схему работы корпоративного отдела продаж, а передать её отделу Developer Relations. На выходе получился бы аналог AWS или Azure.

Текущий статус проекта ACDC неизвестен, потому что отстаивавший эту идею топ-менеджер Майкл Эбботт (Michael Abbott) ушёл из компании в 2023 году, но известно, что идея ещё обсуждалась в первой половине 2024 года. Сейчас Apple из-за действий властей может лишиться привычных источников доходов, в том числе комиссий в App Store и средств по соглашению с Google. Поиск новых представляется актуальным, и запуск собственных облачных сервисов был бы логичным вариантом. А разработчики получили бы альтернативу платформам с дорогостоящими ИИ-ускорителями других производителей.

Alibaba представила ИИ-модель Qwen VLo, которая умеет редактировать картинки

Alibaba представила ИИ нового поколения, который существенно упростит пользователям создание и редактирование изображений на основе текстов и визуальных материалов. Модель, получившая название Qwen VLo, станет частью серии ИИ-сервисов под брендом Qwen и позволит не только генерировать изображения по текстовым запросам, но и модифицировать уже существующие.

 Источник изображения: Copilot

Источник изображения: Copilot

Как сообщает Bloomberg, новая модель не только анализирует данные, но и способна на их основе генерировать высокачественные изображения. Например, пользователь может ввести текстовой запрос, а после генерации попросить добавить какие-либо детали, например, шляпу для кота. Также можно загрузить готовое изображение и «дорисовать» его.

Одной из ключевых особенностей Qwen VLo является технология прогрессивной генерации, при которой пользователь может наблюдать за процессом создания изображения шаг за шагом. Например, можно отправить запрос «Создай картинку милого кота», и система начнёт формировать изображение прямо на глазах.

В своём блоге компания также отметила, что новая версия модели не просто «воспринимает окружающий мир, но и способна создавать высококачественные реконструкции на основе этого восприятия». Это соотносится с тем, что ранее генеральный директор компании Эдди Ву (Eddie Wu) заявлял, что основной целью Alibaba на текущий момент является разработка сильного искусственного интеллекта (AGI), который будет обладать уровнем развития человека.

Модель Qwen VLo позиционируется как конкурентный ответ на другие решения рынка, включая продукты OpenAI. Однако Alibaba также сталкивается с агрессивной конкуренцией внутри Китая, например, со стороны DeepSeek, которая произвела в индустрии фурор, заявив о создании мощной модели всего за несколько миллионов долларов. В ответ компания Alibaba ещё активнее стала добавлять новые функции для обработки текстов, изображений, аудио и видео, также оптимизируя модель и для работы на смартфонах.

Runway готовит платформу для создания игр с помощью ИИ

ИИ-стартап Runway, чья оценочная стоимость составляет $3 млрд, намерен расширить горизонты своего влияния. После крупного успеха нейросети в киноиндустрии, компания планирует запустить платформу для генерации видеоигр.

 Источник изображения: Runway

Источник изображения: Runway

По словам генерального директора компании Кристобаля Валенсуэлы (Cristóbal Valenzuela), первые пользователи смогут протестировать новый продукт уже на следующей неделе. Пока это просто минималистичный интерфейс, позволяющий взаимодействовать с моделью в текстовом чате и создавать изображения, но в дальнейшем появится возможность генерировать полноценные игры, сообщает The Verge.

Runway в настоящий момент активно ведёт переговоры с крупными игровыми студиями о внедрении своих технологий в производственные процессы и о доступе к их базам данных для обучения моделей. По мнению Валенсуэлы, игровая индустрия сейчас находится примерно в той же точке, в которой находилась киноиндустрия пару лет назад, когда впервые столкнулась с применением ИИ в процессе создания контента. Тогда тоже наблюдалось немалое сопротивление, но со временем ИИ-технологии начали активно внедряться в работу. Глава Runway уверен, что сейчас процесс принятия ИИ в играх будет происходить быстрее.

Компания уже имеет опыт сотрудничества с крупнейшими игроками развлекательного рынка. Например, её технологии применялись при производстве сериала Amazon «Дом Дэвида», также продолжается сотрудничество почти со всеми голливудскими студиями и большинством компаний из списка Fortune 100. Валенсуэла считает, что если Runway может помочь студии ускорить производство фильма на 40 процентов, то аналогичный эффект возможен и в разработке игр.

Путин подписал закон о создании национального мессенджера

Владимир Путин подписал Федеральный закон № 156-ФЗ от 24.06.2025 «О создании многофункционального сервиса обмена информацией и о внесении изменений в отдельные законодательные акты Российской Федерации». Документ опубликован на официальном интернет-портале правовой информации. Ожидается, что в дополнение к функциям обмена данными сервис обеспечит доступ к государственным и муниципальным услугам. Также на платформе разместятся образовательные сервисы.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

Компанию, ответственную за разработку, запуск и поддержку национального мессенджера в ближайшее время определит правительство. В качестве обязательных условий запуска национального сервиса в законопроекте указаны его отечественная разработка и включение в реестр российского ПО. Потенциальный подрядчик также должен располагать аудиторией с посещаемостью не менее 500 тыс. пользователей в сутки.

Сервис должен обеспечить создание доверенной и безопасной среды для общения россиян, его можно будет использовать для удостоверения личности вместо бумажных документов. В дальнейшем, после подключения сервиса к системе «Госключ», появится возможность использовать усиленную цифровую подпись.

По сообщению Минцифры, национальный сервис будет развиваться на базе мессенджера Max, разработанного компанией VK. Бета-версия Max была запущена в конце марта 2025 года. Министр цифрового развития России Максут Шадаев пообещал представить национальный мессенджер этим летом. Закон вступает в силу с 1 сентября 2025 года.

«Газпром-Медиа» передумал запускать аудиосервис из-за нежелания конкурировать с «Яндексом» и VK

Холдинг «Газпром-Медиа» отказался от запуска музыкального сервиса «Шум». Об этом в беседе с журналистами на ПМЭФ-2025 рассказал генеральный директор «Газпром-Медиа» Александр Жаров.

 Источник изображения: Eric Nopanen / unsplash.com

Источник изображения: Eric Nopanen / unsplash.com

«Отказались от этой идеи. Посчитали деньги, и надо вложить столько в маркетинг, что срок окупаемости уходит за пределы разумного», — приводит источник слова Жарова. Он также добавил, что в запуске сервиса «Шум» нет экономической целесообразности из-за конкуренции с VK и «Яндексом».

По данным «Яндекс Музыки», в прошлом году объём рынка подписных музыкальных стриминговых сервисов в России вырос более чем на 20 % год к году и составил 32 млрд рублей. Отчётность VK указывает на то, что средняя месячная аудитория сервиса «VK Музыка» в первом квартале нынешнего года составила 49 млн человек, включая 45 млн пользователей в России. При этом рост пользовательской базы год к году составил 19 %. Несмотря на это, «Яндекс» позиционирует «Яндекс Музыку» как крупнейший подписной музыкальный сервис в стране, у которого 28 млн подписчиков в месяц (такие сведения приведены в отчётности компании за первый квартал 2025 года).

О намерении запустить музыкальный сервис «Шум» холдинг «Газпром-Медиа» объявил в 2023 году. На платформе планировалось, в том числе, запустить подкасты, а сама она должна была появиться в рамках плана по развитию онлайн-кинотеатра Premier. Предполагалось, что сервис соберёт аудиоконтент и предоставит доступ к радиостанциям, различной музыке и подкастам в едином приложении онлайн-кинотеатра Premier.

Стриминг аудиоконтента заинтересовал «Газпром-Медиа» в 2022 году, вскоре после того, как из России ушёл сервис Spotify. Тогда Александр Жаров анонсировал скорый запуск платформы «Аудиоклуб», публичная бета-версия которого вышла в сентябре того же года. Однако уже к концу года разработка платформы остановилась. Отказ от реализации проекта в компании объяснили уходом с российского рынка западных мейджоров.

Онлайн-переводчик DeepL перестал работать в России

Популярный онлайн-переводчик на базе искусственного интеллекта DeepL больше недоступен на территории России. Сообщение об этом появляется при попытке перехода на веб-страницу сервиса с российского IP-адреса. Причины блокировки доступа к сервису на данный момент неизвестны.

 Источник изображения: appshunter.io / Unsplash

Источник изображения: appshunter.io / Unsplash

«Этот сервис больше недоступен в вашем регионе», — говорится в сообщении, которое отображается на сайте DeepL при переходе на него с устройств из России. Приложение сервиса также не работает. Как сказано в нём, проблема носит технический характер. Там также сообщается, что над её решением трудятся специалисты, и в скором времени DeepL снова будет доступен.

Напомним, онлайн-переводчик DeepL начал работать в августе 2017 года, а годом позже разработчики запустили платную версию DeepL Pro. Штаб-квартира сервиса располагается в Кёльне, Германия.

В настоящее время на территории России остаётся доступным сервис Google Translate, а также некоторые другие онлайн-переводчики, в том числе отечественный «Яндекс Переводчик».

«Бездонная яма плагиата»: Disney и Universal подали в суд на Midjourney из-за ИИ

Кинокомпании Disney и Universal подали иск против Midjourney, обвинив сервис в создании копий их персонажей с помощью искусственного интеллекта (ИИ). Иск, поданный в федеральный суд Центрального округа Калифорнии, касается генерации изображений таких персонажей, как Шрек, Дарт Вейдер, Базз Лайтер и других защищённых авторским правом известных героев.

 Источник изображений: theverge.com

Источник изображений: theverge.com

В заявлении говорится, что Midjourney действует как «виртуальный торговый автомат», производя бесконечные незаконные копии их работ. По мнению истцов, сервис сознательно использует популярных персонажей для продвижения своих инструментов, не вкладывая средств в их создание. В качестве примеров приведены изображения инопланетянина Йоды — одного из главных героев «Звёздных войн», Человека-паука, Эльзы из «Холодного сердца» и персонажей из «Миньонов».

Disney и Universal утверждают, что Midjourney игнорирует их требования прекратить нарушение авторских прав, в отличие от других сервисов ИИ, которые внедрили защитные механизмы. Особую обеспокоенность вызывает готовящийся к выпуску видеогенератор Midjourney, который, по мнению студий, уже сейчас может нарушать их права в связи с обучением ИИ на защищённом авторском контенте. Компании потребовали суда присяжных.

Как отмечает издание The Verge, это первый крупный иск Голливуда против генеративного ИИ, однако подобные судебные разбирательства становятся все более частыми. Ранее с исками к OpenAI, создателю ChatGPT, обращались The New York Times, группа авторов во главе с Джорджем Мартином (George R.R. Martin), а также издатели других газет. На компанию Anthropic, разработавшую чат-бот Claude, подали иски компании Universal Music и Reddit.

ВТБ начал тестировать отечественный заменитель Apple Pay — сервис «Волна» от НСПК

Второй по величине банк в России ВТБ начал приём платежей через СБП с помощью нового инструмента для бесконтактной оплаты «Волна» в рамках пилотного проекта, пишут «Ведомости». Новая технология использует Bluetooth, поэтому для тестирования в эквайринговой сети ВТБ применяются новые виды платёжных терминалов с поддержкой этого протокола беспроводной связи.

 Источник изображения: Jonas Leupe/unsplash.com

Источник изображения: Jonas Leupe/unsplash.com

Сервис «Волна» был разработан Национальной системой платёжных карт (НСПК). Прототип инструмента был представлен в октябре 2024 года. С его помощью можно бесконтактно оплачивать покупки смартфонами на базе Android и iOS, для чего достаточно поднести устройство к платёжному терминалу.

После завершения пилотного проекта новый платёжный инструмент дополнит существующую в ВТБ линейку продуктов для приема платежей, сообщили в банке. По словам руководителя департамента анализа, координации и продуктового развития ВТБ Юлии Копытовой, в пилотном проекте, который проводится в Москве, Московской области и Казани, будут задействованы около 100 торговых точек.

В НСПК сообщили, что эквайринговую часть решения «Волна» уже протестировали совместно с четырьмя крупными российскими банками, не раскрывая их названий.

Ранее об участии в тестировании технологии сообщали Московский кредитный банк и банк «Синара». Банк «Дом.РФ» и «Промсвязьбанк» вошли в число участников пилотного проекта в этом году. «Сбербанк» планирует запустить собственное решение — альтернативу Apple Pay — во второй половине 2025 года, писали ранее «Известия».

В настоящее время банкам доступна технология для встраивания «Волны» в клиентские мобильные приложения для проведения оплаты через СБП, сообщил представитель НСПК. Также в НСПК разработали технологию для приёма оплаты по картам «Мир», которую уже в этом году начнут использовать несколько банков.

OpenAI ослабила зависимость от Microsoft — она будет использовать Google Cloud, несмотря на соперничество ChatGPT и Gemini

OpenAI заключила партнёрское соглашение с Google Cloud. Компания стремится диверсифицировать свои облачные мощности и избавиться от высокой зависимости от Microsoft, поэтому будет использовать облачные сервисы Google Cloud для удовлетворения своих растущих потребностей в вычислительных мощностях. Сделке не помешало соперничество моделей искусственного интеллекта компаний, как и то, что OpenAI стал основным конкурентом Google на рынке интернет-поиска.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

OpenAI планирует использовать облачный сервис Google для удовлетворения своих растущих потребностей в вычислительных мощностях, что стало неожиданным сотрудничеством двух известных конкурентов в секторе искусственного интеллекта. Сделка обсуждалась в течение нескольких месяцев и обрела окончательный вид в конце мая. Аналитики полагают, что она долгое время была «заблокирована от подписания из-за привязки OpenAI к Microsoft».

Неожиданное партнёрство Google и OpenAI подчёркивает, как огромные потребности в вычислениях для обучения и развёртывания моделей ИИ меняют конкурентную динамику в сфере ИИ, и знаменует собой последний шаг OpenAI по диверсификации своих источников вычислений за пределами своего основного спонсора Microsoft.

Неясно, каковы будут масштабы использования OpenAI облачных сервисов Google, но это, безусловно, крупная сделка для обеих компаний.

Google научила Gemini 2.5 понимать и передавать эмоции в диалогах

На конференции Google I/O 2025 компания анонсировала новую версию своей мультимодальной модели Gemini 2.5, которая теперь поддерживает генерацию аудио и диалогов в реальном времени. Эти возможности доступны в предварительной версии для разработчиков через платформы Google AI Studio и Vertex AI.

 Источник изображения: Google

Источник изображения: Google

Gemini 2.5 Flash Preview обеспечивает реалистичное голосовое взаимодействие с ИИ, включая распознавание эмоциональной окраски речи, адаптацию интонации и акцента, а также возможность переключения между более чем 24 языками. Модель может игнорировать фоновые шумы и использовать внешние инструменты, такие как «Поиск», для получения актуальной информации во время диалога.

Дополнительно, Gemini 2.5 предлагает расширенные функции синтеза речи (TTS), позволяя управлять стилем, темпом и эмоциональной выразительностью озвучивания. Поддерживается генерация диалогов с несколькими голосами, что делает модель подходящей для создания подкастов, аудиокниг и других мультимедийных продуктов.

Для обеспечения прозрачности, все сгенерированные моделью аудио маркируются с помощью технологии SynthID, что позволяет идентифицировать контент, как сгенерированный ИИ. Разработчики могут опробовать новые функции через вкладки Stream и Generate Media в Google AI Studio.

Gemini 2.5 демонстрирует значительный шаг вперёд в области мультимодальных ИИ-систем, объединяя модальности текстов, изображений, аудио и видео в единую платформу. Новые функции открывают широкие перспективы для создания интерактивных приложений, виртуальных ассистентов и инноваций в сфере образования.

Character.AI запустила генерацию видео, а персонажи теперь могут говорить

Платформа Character.AI с функциями чат-бота для диалогов с ИИ-персонажами представила новые мультимедийные функции. Среди них — генератор видео AvatarFX, а также инструменты Scenes и Streams, позволяющие создавать ролики с ИИ-персонажами и делиться ими в социальной ленте.

 Источник изображения: Character.AI

Источник изображения: Character.AI

Ранее сервис работал только в текстовом формате, но теперь, по словам представителей компании, развивается в сторону большей интерактивности. Сейчас пользователи могут создавать до пяти видео в день с помощью AvatarFX. Для этого нужно загрузить изображение, выбрать голос и написать реплики для персонажа. Также есть возможность использовать аудиофайл для настройки голоса, но эта функция, как отмечает TechCrunch, пока работает нестабильно.

Видео можно превращать в сцены (Scenes), представляющими из себя мини-истории с заранее заданными сюжетами от других пользователей. Пока эта опция доступна только в мобильном приложении, но скоро появится и в веб-версии. Функция Streams, позволяющая создавать динамические диалоги между двумя персонажами, выйдет на всех платформах на этой неделе. Готовые сцены можно будет публиковать в новой ленте сообщества.

Однако у платформы есть проблемы с безопасностью из-за риска злоупотребления столь широкими возможностями. Ранее родители подавали в суд на Character.AI, утверждая, что чат-боты пытались склонить их детей к самоповреждениям и суициду. В одном случае 14-летний подросток покончил с собой после продолжительного общения с ИИ-персонажем.

С расширением мультимедийных функций также могут возрастать риски злоупотреблений, например, использования фотографий реальных людей. Но компания заявляет, что блокирует загрузку изображений реальных людей, включая знаменитостей, и намеренно искажает их изображения (рисунок ниже), чтобы избежать создания deep-подделок. Однако иллюстрации с известными персонажами система не запрещает, что, возможно, оставляет лазейки для злоумышленников.

 Источник изображения: Character.AI

Источник изображения: Character.AI

Каждое видео помечается водяным знаком, но это не гарантирует полной защиты. Например, при попытке создать дипфейк на основе рисунка Илона Маска (Elon Musk) результат выглядит неестественно, но теоретически такие ролики всё равно можно использовать для обмана.

 Источник изображения: Amanda Silberling / bsky.app

Источник изображения: Amanda Silberling / bsky.app

В Character.AI подчёркивают, что «стремятся балансировать между творческой свободой и безопасностью». По словам компании, цель платформы в том, чтобы предоставить пользователям интересные инструменты для самовыражения, минимизируя потенциальные угрозы. Однако есть те, кто сомневается, что текущих мер недостаточно для предотвращения новых скандалов.

«Будем душить»: Минцифры РФ хочет ограничить работу AWS и прочих зарубежных облачных сервисов

Минцифры РФ допускает вероятность поэтапного ограничения доступа к зарубежным облачным сервисам, у которых имеются российские аналоги. Об этом в рамках мероприятия Tadviser Summit рассказал министр цифрового развития Максут Шадаев.

 Источник изображения: Albert Stoynov / Unsplash

Источник изображения: Albert Stoynov / Unsplash

«Президент сказал — будем душить», — приводит источник слова господина Шадаева. Он также добавил, что блокировка сервисов нужна для поддержки отечественных компаний, а также для того, чтобы дать им возможность получения дополнительных заработков. Глава Минцифры отметил, что отечественные аналоги часто используют «зарубежные решения» и «сложные механизмы», что сказывается на простоте их оплаты.

По мнению Максута Шадаева, главной причиной, по которой в стране остаются зарубежные IT-гиганты, является конфликт привычки пользователя. Если же зарубежные компании не ведут деятельность в стране, странно, что россияне до сих пор продолжают приносить им деньги, считает министр.

Напомним, на прошедшей недавно встрече с представителями деловых кругов Владимир Путин согласился с тем, что необходимо бороться с зарубежными компаниями, которые продолжают работать в России без прав, а также призвал «душить» их. Он заявил, что Россия предоставляла таким компаниям «максимально благоприятные условия» для работы, однако они попытались «задушить» российский рынок.

Stability AI выпустила ИИ-генератор музыки, который быстро работает даже на смартфоне

Stability AI, разработчик популярной нейросети Stable Diffusion, представила музыкальную ИИ-модель Stable Audio Open Small, которая генерирует аудио в стереозвучании и способна работать на смартфонах без подключения к интернету. Модель создана совместно с производителем чипов Arm, чьи процессоры используются в большинстве мобильных устройств, и способна быстро генерировать аудио в высоком качестве даже на устройствах с ограниченными вычислительными ресурсами.

 Источник изображения: AI

Источник изображения: AI

В отличие от конкурентов, таких как Suno и Udio, которым требуется облачная обработка, Stable Audio Open Small работает локально. При этом, как отмечает TechCrunch, обучение модели проводилось только на данных из бесплатных аудиобиблиотек Free Music Archive и Freesound, что снижает риски нарушения авторских прав и выгодно отличает её от некоторых других ИИ-сервисов, использующих защищённый контент.

Модель содержит 341 миллион параметров и оптимизирована для процессоров Arm. Она предназначена для быстрого создания коротких аудиосэмплов и звуковых эффектов, например, ударных или инструментальных партий. По заявлению Stability AI, на смартфоне ИИ может сгенерировать 11-секундное аудио менее чем за восемь секунд.

Одновременно у Stable Audio Open Small есть некоторые ограничения. Например, она понимает текстовые запросы только на английском языке, не умеет создавать реалистичный вокал или сложные музыкальные композиции. Кроме того, компания признаёт, что из-за того, что модель обучалась на западно-ориентированных данных, она лучше справляется со стилями, присущими западной музыке.

Ещё одна сложность заключается в условиях использования. Для исследователей, любителей и малого бизнеса ИИ-модель доступна бесплатно, но если годовой доход компании превышает $1 млн, потребуется покупка коммерческой лицензии. И хотя для инди-разработчиков такие условия выгодны, для крупных проектов это может стать определённой сложностью.

Напомним, Stability AI, известная по своей модели глубокого обучения Stable Diffusion, генерирующей изображения по текстовым описаниям, в последние месяцы пытается восстановить репутацию после финансовых проблем при бывшем генеральном директоре Эмаде Мостаке (Emad Mostaque). Компания привлекла инвестиции, назначила нового главу и добавила в совет директоров режиссёра Джеймса Кэмерона (James Cameron). Параллельно она продолжает выпускать новые генеративные модели, включая новые инструменты для создания изображений.

Временный глава Sonos признал серьёзные ошибки компании и начал их исправлять

Временный генеральный директор Sonos Том Конрад (Tom Conrad) признал серьёзные ошибки компании, допущенные при обновлении фирменного приложения в мае 2024 года. В эксклюзивном интервью изданию Wired он рассказал о причинах катастрофического сбоя, затронувшего тысячи пользователей, а также о предпринятых мерах по восстановлению доверия клиентов. Несмотря на непростой год, включавший смену руководства и сокращение персонала, компании удалось превзойти финансовые ожидания по итогам II квартала 2025 года.

 Источник изображений: Sonos

Источник изображений: Sonos

Почти год назад, 7 мая 2024 года, компания Sonos выпустила обновление своего мобильного приложения, которое моментально вызвало волну негативных откликов среди пользователей. Обновлённая версия дезактивировала ряд функций и нарушила работу ключевых возможностей мультирумных аудиосистем, включая таймеры сна и регуляторы громкости. Преданные пользователи, многие из которых вложили сотни долларов в устройства Sonos, были возмущены внезапной потерей функциональности своих систем.

«Мы все чувствуем себя действительно ужасно из-за этого», — признался Конрад, возглавивший компанию после ухода Патрика Спенса (Patrick Spence) с поста генерального директора в январе 2025 года. Конрад, член совета директоров Sonos с 2017 года, откровенно рассказал о проблемах, с которыми столкнулась компания. По его словам, Sonos допустила три критические ошибки: сознательно запустила приложение без некоторых редко используемых функций, радикально изменила пользовательский интерфейс и — что самое важное — недооценила разнообразие реальных условий эксплуатации своих мультирумных устройств.

«Если бы мы понимали реальные характеристики надёжности и производительности продукта в домах наших клиентов, мы бы никогда не выпустили это программное обеспечение», — подчеркнул Конрад. Он отметил, что компания не учла сложности сетевых сред, в которых работают устройства Sonos: от перегруженных Wi-Fi-сетей в многоквартирных домах до нестандартных пользовательских конфигураций и взаимодействия с сервисами других компаний, включая музыкальные стриминговые платформы Spotify и Apple.

 Источник изображений: Sonos

Приход Конрада на пост временного CEO совпал с чередой личных испытаний. За неделю до начала работы ему пришлось эвакуироваться с семьёй из-за лесных пожаров в Южной Калифорнии, а спустя несколько дней его дом подвергся ограблению. Однако личные проблемы не помешали ему приступить к масштабной реорганизации компании, включавшей сокращение штата на 12 %. В августе 2024 года Sonos уволила около 100 человек, а в феврале 2025 года — ещё 200 сотрудников.

Одним из ключевых изменений стала перестройка работы продуктовых команд. «Когда я пришёл, мы обнаружили десятки проектов в работе, — поясняет Конрад. — Слишком многие из них были недостаточно укомплектованы для достижения успеха, а их относительные приоритеты оставались неясными». В первые четыре недели своего руководства он сократил число проектов с десятков до примерно десяти, что позволило сосредоточить ресурсы компании на наиболее значимых направлениях.

Особое внимание Конрад уделил программному обеспечению. Впервые в истории Sonos были сформированы масштабные команды, занимающиеся исключительно совершенствованием программной платформы. «По десяткам метрик наша нынешняя платформа работает лучше, чем программное обеспечение, которое она заменила», — утверждает он, подчёркивая значительный прогресс, достигнутый за последние полгода.

 Источник изображений: Sonos

Этот акцент на программном обеспечении отражает видение Конрада: он рассматривает Sonos как платформенную компанию, а не просто как производителя аудиооборудования. «Есть соблазн попытаться ответить на вопрос: это аппаратная компания или программная? Но моя склонность — охватить обе стороны», — объясняет он. По его мнению, именно интеграция высококачественного оборудования с передовым программным обеспечением выделяет Sonos среди конкурентов.

При этом генеральный директор не уклоняется от ответственности за произошедшие провалы. «Я был в совете директоров, и это случилось, по крайней мере частично, на моём дежурстве», — признаёт он. Именно поэтому Конрад начал регулярно посещать бостонский офис Sonos ещё в августе 2024 года, чтобы лично работать с инженерами над решением технических проблем, а затем согласился оставить прежнюю работу и место жительства, чтобы возглавить компанию и вернуть её на правильный путь.

Несмотря на все трудности, недавний финансовый отчёт Sonos за II квартал 2025 года превзошёл ожидания аналитиков по прибыли. Это даёт Конраду основания для осторожного оптимизма. Хотя его текущая должность обозначена как «временный генеральный директор», он уже задумывается о долгосрочных перспективах. «Если совет директоров решит, что я — постоянное решение, будет здорово расширить горизонты до пяти-десяти лет», — отмечает он, добавляя, что у него «целая куча идей» относительно будущего направления развития компании.


window-new
Soft
Hard
Тренды 🔥
Разработчики Subnautica 2 не объяснили внезапную смену руководства, но зато в игре не будет лутбоксов и боевых пропусков 3 ч.
Издатели пожаловались на Google в Еврокомиссию — они несут убытки от ИИ-обзоров в поиске 3 ч.
«Очень грустный день для одной из лучших гоночных игр»: бывший сотрудник Turn 10 прояснил судьбу Forza Motorsport после массовых увольнений в студии 4 ч.
Анонсирована Resident Evil: Survival Unit — это мобильная хоррор-стратегия на выживание от соавтора Kingdom Hearts 5 ч.
Способность ИИ к пониманию собственных слов оказалась «потёмкинской» 6 ч.
«Яндекс» обновил «Нейроэксперта» — ИИ научился рассуждать и анализировать сайты целиком 9 ч.
Продажи Rust на ПК превысили 20 млн копий — игра заслужила больше миллиона положительных обзоров в Steam 10 ч.
Исследование: поиск информации в Google может подавлять креативность 10 ч.
Цукерберг снова обещает революцию — ИИ-амбиции Meta напомнили о провале метавселенной 10 ч.
«Ростелеком» нацелился создать конкурента Steam и VK Play, в том числе для российской игровой консоли 11 ч.
США хотят ограничить поставки ИИ-чипов в Малайзию и Таиланд, потому что оттуда они нелегально мигрируют в Китай 3 ч.
Разработчик RISC-V-чипов Codasip готов продаться — целиком или по частям 3 ч.
ИИ провоцирует резкие скачки потребления электроэнергии, что разрушает энергетическую инфраструктуру по всему миру 3 ч.
«Джеймс Уэбб» запечатлел яркое столкновение двух скоплений галактик 3 ч.
Большинство новейших видеокарт по-прежнему продаются с наценкой в 12–57 % — особенно GeForce RTX 5090 и 5080 3 ч.
Fairphone 6 получил высшую оценку ремонтопригодности от iFixit 5 ч.
TSMC отложила строительство второго завода чипов в Японии ради расширения производства в США 5 ч.
Геймер превратил Honda CR-V в игровой контроллер для Need for Speed Underground 6 ч.
Xbox, Surface и Windows превратились в отстой — и это часть плана самой Microsoft 7 ч.
«РТК-ЦОД» дополнила «Публичное облако» сервисом защиты сети на базе NGFW 8 ч.