Сегодня 13 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Microsoft AI представила три собственные ИИ-модели для генерации текста, голоса и изображений

Исследовательское подразделение Microsoft AI представило три новые модели искусственного интеллекта (ИИ), способные генерировать текст, голос и изображения. В конкурентной борьбе с ведущими технологическими ИИ-лабораториями компания решила усилить свои позиции сделав ставку на собственную мультимодальную инфраструктуру.

 Источник изображения: xAI

Источник изображения: xAI

Модель MAI-Transcribe-1 переводит речь на 25 языках в текст, опережая по скорости сервис Azure Fast в 2,5 раза. Вторая модель MAI-Voice-1 создаёт минутную аудиодорожку за одну секунду и поддерживает настройку голосов. MAI-Image-2 отвечает за генерацию визуального контента по текстовому описанию.

По сообщению TechCrunch, над проектом работала команда MAI Superintelligence, занимающаяся фундаментальными исследованиями в области продвинутых ИИ-систем, которую в ноябре 2025 года возглавил исполнительный директор подразделения Мустафа Сулейман (Mustafa Suleyman).

В текущем проекте разработчики сделали упор на снижение стоимости вычислений по сравнению с аналогами от Google и OpenAI. Тарификация расшифровки текста начинается от $0,36 в час, синтез речи оценивается в $22 за 1 миллион символов, а работа с изображениями обойдётся в $5 за 1 миллион входных токенов и $33 за генерацию 1 миллиона выходных токенов. Все модели уже развёрнуты на платформе Microsoft Foundry, а модели транскрипции и синтеза речи также доступны в MAI Playground.

Несмотря на активный выпуск собственных разработок, Сулейман в интервью VentureBeat подтвердил приверженность партнёрству с OpenAI, в которую Microsoft уже инвестировала более $13 млрд. Корпорация продолжит использовать модели OpenAI в своих продуктах в рамках многолетнего контракта, применяя ту же стратегию диверсификации, что и при работе с микрочипами.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В iOS 27 появится новый жест для вызова поиска через Dynamic Island 53 мин.
Red Hat анонсировала интегрированную ИИ-платформу Red Hat AI 3.4 6 ч.
Google объявила, что Android-смартфоны массово научатся передавать файлы на iPhone через AirDrop 7 ч.
«Быстро, жестоко и бескомпромиссно олдскульно»: анонсирован ретрошутер Nailcrown в эстетике тёмного фэнтези 8 ч.
Роскомнадзор уже третий раз за полгода опроверг слухи о блокировке Minecraft в России 8 ч.
OpenAI вооружила европейские компании ИИ-моделью GPT-5.5-Cyber для защиты от хакеров 9 ч.
Анонсирован необычный кооперативный роглайт Kingfish, в котором смешались экшен и градостроительная стратегия 9 ч.
Бывший босс Tekken ушёл из Bandai Namco для создания «по-настоящему великих» игр в новой студии 11 ч.
Как у Маска: в Threads внедрят ИИ-бота, который сможет участвовать в обсуждениях и проверять информацию 12 ч.
Обновление Dell SupportAssist вызвало массовые «синие экраны смерти» и бесконечные перезагрузки ноутбуков 12 ч.
Руководство Samsung так и не пошло навстречу требованиям профсоюза, угроза забастовки усилилась 25 мин.
Panasonic представила компактную камеру Lumix L10 с сенсором от флагмана GH7 48 мин.
Новая статья: Обзор WQHD IPS-монитора Digma Progress 27P502Q: минимум - 2026 5 ч.
Новая статья: Обзор планшета HUAWEI MatePad Mini: заполняющий пустоту 7 ч.
Google ведёт переговоры со SpaceX о запуске орбитальных дата-центров в рамках собственной программы Suncatcher 7 ч.
США готовят запрет китайских сотовых модулей — это больно ударит по смарт-устройствам 10 ч.
Google вот-вот представит Googlebook — замену хромбукам с глубокой интеграцией ИИ Gemini 11 ч.
FSP показала 2000-ваттный блок питания — хватит даже для систем с несколькими GPU и CPU 12 ч.
Машины научили «жаловаться» на ямы на дорогах — ИИ передаёт данные дорожным службам 12 ч.
Дата-центры всё чаще строят вне городов — там меньше протестов и бюрократии 13 ч.