Новости Software

Intel представила огромные наборы данных, которые упростят обучение ИИ распознаванию речи

На проходящей в эти дни ежегодной конференции Neural Information Processing Systems (NeurIPS), которая посвящена искусственному интеллекту и машинному обучению, компания Intel представила два проекта, которые связаны с распознаванием и транскрибированием разговорного языка. Проект The People’s Speech нацелен на решение задач «автоматического распознавания речи», тогда как проект Multilingual Spoken Words Corpus (MSWC) предназначен для «поиска ключевых слов».

Источник изображения: Intel

Источник изображения: Intel

В рамках каждого из проектов были созданы наборы данных, содержащие значительный объём аудиоданных и входящие в число крупнейших коллекций в своём классе. Обе инициативы были запущены в 2018 году, чтобы определить и свести в единый набор данных 50 наиболее используемых языков мира, а затем найти применение этой информации. В рамках The People’s Speech и MSWC инженеры Intel сотрудничали с коллегами из Alibaba, Oracle, Google, Baidu и др.

В рамках проекта People’s Speech разработчики создали набор данных, включающий в себя десятки тысяч часов контролируемого разговорного аудио. В настоящее время это один из крупнейших в своём классе наборов данных на английском языке, лицензированный для академического и коммерческого использования и доступный для бесплатного скачивания.

В это же время MSWC — это набор аудиоречевых данных, содержащий более 300 тыс. ключевых слов на десятках языках и доступный для интеллектуальных устройств. Набор данных MSWC охватывает языки, на которых разговаривают более 5 млрд человек и способствует разработке голосовых приложений для широкой аудитории. Оба набора данных будут доступны разработчикам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...
window-new
Soft
Hard
Тренды 🔥
Глава Activision Blizzard подумывал купить крупное игровое издание для «смягчения» ситуации после скандала с домогательствами 8 мин.
До конца года будут запущены сервисы TON Foundation от последователей Дурова 14 мин.
Apple: из-за антимонопольных законов «миллионы американцев» могут пострадать от вредоносных атак 19 мин.
Журналисты выставили первые оценки Rainbow Six Extraction — идеальная игра для Game Pass? 60 мин.
AMD выпустила драйвер Radeon Adrenalin 22.1.2 с поддержкой Radeon RX 6500 XT и других новых видеокарт 2 ч.
Новая статья: Tom Clancy's Rainbow Six Extraction — не такая, как все. Рецензия 2 ч.
Видео: новый трейлер пошаговой ролевой стратегии Expeditions: Rome посвятили осадам 3 ч.
Библиотека расширенной подписки Nintendo Switch Online пополнится первой Banjo-Kazooie 3 ч.
Системные требования GRID Legends: для комфортной игры нужны Core i5-8600K и GTX 1080 3 ч.
Европол отключил популярный у киберпреступников сервис VPNLab 4 ч.
Emirates, Air India и другие авиакомпании отменили рейсы в США из-за вышек 5G-сетей рядом с аэропортами 25 мин.
Samsung случайно показала загадочный планшет с «чёлкой» — вероятно, это Galaxy Tab S8 Ultra 2 ч.
Перспективным источником лития для аккумуляторов станут геотермальные источники 2 ч.
Акционеры Tesla через суд потребовали у Маска $13 млрд за поглощение SolarCity 2 ч.
Intel договорилась с ASML о поставке оборудования для запуска техпроцесса 18A в 2025 году 2 ч.
IDC: ежегодный прирост расходов на облачную инфраструктуру вычислений и хранения останется в пределах 12,4% до 2025 года 3 ч.
Слияние Microsoft и Activision Blizzard станет крупнейшей в истории сделкой в технологическом секторе 3 ч.
ASML планирует увеличить выручку на 20 % в этом году — пожар на предприятии в Берлине не помешает 4 ч.
SpaceX успешно запустила в космос очередную партию спутников Starlink — теперь у Маска больше 2000 аппаратов на орбите 5 ч.
Японский 222-метровый паром совершил первый рейс в автономном режиме — он преодолел 240 км 5 ч.