Сегодня 11 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → распознавание речи

«Т-Банк» выпустил ИИ-модель распознавания речи с открытым исходным кодом — T-one

Российская группа компаний «Т-Технологии», владеющая «Т-Банком», опубликовала собственную ИИ-модель распознавания речи с открытым исходным кодом. Речевая модель под названием T-one обещает новый уровень качества распознавания, по словам её разработчиков. Также обещаются прорывные решения, такие как распознавание речи в реальном времени, передаёт Forbes.

 Источник изображения: «Т-Технологии»

Источник изображения: «Т-Технологии»

Более подробно о T-one представители «Т-Технологий» рассказали 19 июля в Москве на Второй конференции по машинному обучению Turbo ML. А на официальном ресурсе компании на платформе GitHub объясняется, что T-one — это высокопроизводительная система автоматического распознавания речи (ASR) с акцентом на распознавание русского языка в телефонии. Кстати, на GitHub она уже доступна для скачивания. Также её можно загрузить с Hugging Face. Для разработчиков приведены инструкции по развёртыванию системы.

T-one — модель относительно небольшая, около 70 млн параметров. Для сравнения, речевая модель компании GigaAM от «Сбера» состоит из 240 млн параметров, а модель Whisper large-v3 от OpenAI — из 1,55 млрд. Однако, по утверждениям разработчиков T-One, это не мешает последней обгонять именитых конкурентов именно в распознавании русской речи в телефонных разговорах, под что она «заточена».

«Т-Технологии» позиционируют свою разработку как для бизнеса, так и для научного сообщества. Второму она будет интересна низкой стоимостью: эксплуатация на собственном сервере должна быть в десятки раз дешевле конкурирующих решений от облачных провайдеров. T-one хорошо адаптируется под нужды конкретной компании и разработку собственных решений.

«Это могут быть компании, разрабатывающие голосовых роботов и ассистентов, занимающиеся автоматизацией кол-центров, — пояснили представители «Т-Технологий» на конференции Turbo ML. — Они могут взять за основу эту модель и адаптировать её под свои решения. Это позволит сократить ресурсы на разработку с нуля».

Meta✴ в партнёрстве с ЮНЕСКО запускает новую программу сбора данных для улучшения речи и перевода ИИ

LTPP (Language Technology Partner Program — партнёрская программа по языковым технологиям) — совместная инициатива ЮНЕСКО и Meta✴ по поиску авторов, которые могут предоставить более 10 часов записей речи с транскрипциями, большие объёмы письменного текста и наборы переведённых текстов на разных языках. В дальнейшем эти данные будут интегрированы в ИИ-модели с открытым исходным кодом для распознавания речи и перевода.

 Источник изображения: dailysabah.com

Источник изображения: UNESCO

Усилия LTPP будут сосредоточены на недостаточно обслуживаемых языках для поддержки работы, уже проводимой в этом направлении ЮНЕСКО. «В конечном итоге наша цель — создать интеллектуальные системы, которые могут понимать и реагировать на сложные потребности человека, независимо от языка или культурного происхождения», — заявил представитель Meta✴.

В дополнение к новой инициативе Meta✴ опубликовала открытый исходный код программы для оценки производительности моделей языкового перевода. Тест, состоящий из предложений, созданных лингвистами, поддерживает семь языков, и доступен на платформе разработки ИИ Hugging Face.

Meta✴ продолжает расширять количество языков, поддерживаемых её ИИ-моделями и развивать функции автоматического перевода для создателей контента. В сентябре прошлого года компания начала тестирование инструмента для перевода голосов в Instagram✴ Reels, который дублирует речь создателя на другом языке с автоматическим липсинком.

На сегодняшний день обработка на платформах Meta✴ контента на языках, отличных от английского, далека от совершенства. По некоторым данным, в соцсети Facebook✴ 79 % дезинформации о COVID на итальянском и испанском языках не были распознаны и отмечены системой, по сравнению с 29 % на английском языке. А сообщения на арабском языке, наоборот, часто ошибочно помечаются как разжигающие ненависть.

Meta✴ заявила, что принимает меры по улучшению своих технологий перевода и модерации. И, хотя компания позиционирует обе свои языковые инициативы как филантропические, нет никаких сомнений, что главным бенефициаром этих программ станет именно Meta✴, которая сможет существенно улучшить качество распознавания речи и перевода.


window-new
Soft
Hard
Тренды 🔥
Смартфоны Samsung начнут блокировать приложения с назойливой рекламой в уведомлениях 30 мин.
Фанатов заинтриговал мод, который переносит в Half-Life главную героиню Life is Strange — геймплей и подробности Half-Life is Strange 49 мин.
TikTok позволит полностью отключить рекламу — но не бесплатно и не всем 2 ч.
«Никогда и ни за что»: Red Hook Studios не будет генерировать голос покойной звезды Darkest Dungeon с помощью ИИ, несмотря на разрешение 3 ч.
ИИ упростил создание рекламы для малого бизнеса, но выделиться стало сложнее 6 ч.
WhatsApp запустил платную подписку Plus на iOS с темами, значками и 18 акцентными цветами 6 ч.
Джазовый ретрошутер Mouse: P.I. For Hire достиг новой вершины продаж и уже отбил все затраты на разработку 7 ч.
Пираты «угнали» Forza Horizon 6 за 9 дней до релиза — помогли сами разработчики 11 ч.
Уютный градостроительный симулятор Town to City выйдет из раннего доступа Steam до конца мая 24 ч.
Nvidia подтвердила утечку данных пользователей GeForce Now через армянские сервера 10-05 17:59
Первая частная индийская ракета отправится в космос уже этим летом — шансы на успех не высоки, и это нормально 22 мин.
Intel и Nvidia скоро выпустят первые совместные продукты, заверил гендир Тан 2 ч.
Смартфон Трампа может вообще не выйти — предзаказ не гарантирует даже запуск производства 2 ч.
Ключевые характеристики геймерского смартфона RedMagic 11S Pro раскрылись до анонса 3 ч.
Broadcom представила решения 10G PON и Wi-Fi 8 для организации ШПД 5 ч.
Verda и Compal объединили усилия для создания ИИ-инфраструктуры следующего поколения 5 ч.
PowerColor выпустила тонкую профессиональную видеокарту Radeon AI PRO R9600D с разъёмом 12V-2×6 6 ч.
SK hynix может привлечь Intel вместо TSMC к выпуску памяти HBM4 6 ч.
Китайские производители чипов могут заработать на буме ИИ даже без передовых техпроцессов, уверен глава SMIC 7 ч.
Huawei выпустила телевизоры Smart Screen S7 с подсветкой Super Mini-LED и частотой обновления до 300 Гц 7 ч.