Сегодня 26 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

«Яндекс» представил YaLM 100B — самую большую открытую нейросеть для генерации текстов

Компания «Яндекс» анонсировала нейросеть YaLM 100B, предназначенную для генерации и обработки текстов на русском и английском языках. Утверждается, что на сегодняшний день это самая большая в мире GPT-подобная (Generative Pre-trained Transformer) модель, опубликованная в свободном доступе.

 Источник изображений: pixabay.com / geralt

Источник изображений: pixabay.com / geralt

YaLM 100В содержит 100 млрд параметров — больше, чем какая-либо из существующих моделей для русского языка. Благодаря этому нейросеть можно применять для решения широкого круга задач, связанных с обработкой естественного языка.

Языковые модели семейства YaLM определяют принцип построения текстов и генерируют новые, опираясь на законы лингвистики и свои знания о мире. Допускается формирование текстов любого типа: это могут быть ответы, стихи, поздравления и пр. Более того, алгоритмы способны придумывать идеи для рекламных кампаний, создавать описания товаров и видео, а также классифицировать тексты.

 Источник изображения: pixabay.com / Gerd Altmann

Источник изображения: pixabay.com / Gerd Altmann

В процессе обучения сети были задействованы суперкомпьютеры «Яндекса», признанные самыми мощными в Восточной Европе. YaLM 100B обработала около 2 Тбайт текстов из открытых источников и интернета на английском и русском языках.

Теперь нейросеть могут использовать разработчики и исследователи со всего мира. Модель предоставляется по открытой лицензии Apache 2.0 и доступна на GitHub.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Microsoft получает всё больше выгоды от ИИ — компания показала сильный квартальный отчёт 2 мин.
Газировка с Copilot: Microsoft получила миллиардный контракт на обеспечение Coca-Cola облачными и ИИ-сервисами 5 мин.
Продюсер «Смуты» раскрыл, что добавят в игру с обновлениями, и подтвердил работу над продолжением 23 мин.
ИИ-приложение Google Gemini стало совместимо с Android 10 и Android 11 47 мин.
В США вернули сетевой нейтралитет 2 ч.
Alphabet объявила о первых в своей истории дивидендах, акции выросли в цене на 11,4 % 2 ч.
Младенец-экстрасенс против секретной корпорации: соавторы Before Your Eyes анонсировали сюжетное приключение Goodnight Universe 2 ч.
AMD выпустила драйвер с поддержкой игры Manor Lords и исправлением множества ошибок 8 ч.
Telegram обновился: рекомендованные каналы, дни рождения, трансляция геопозиции и аватарки при пересылке 13 ч.
В Steam и на консолях вышел боевик Another Crab's Treasure в духе Dark Souls, но про краба-отшельника — игроки в восторге 13 ч.
Meta увеличит инвестиции в развитие инфраструктуры ИИ и готовит крупнейшие капиталовложения в истории компании 14 мин.
HPE построила самый мощный в Польше суперкомпьютер Helios производительностью 35 Пфлопс 15 мин.
AWS построит в Индиане кампус ЦОД стоимостью $11 млрд 25 мин.
США усиливают давление на Японию, Южную Корею и Нидерланды, требуя ужесточить антикитайские санкции 30 мин.
Honor вышел в лидеры китайского рынка смартфонов, на втором месте — Huawei 42 мин.
Samsung заключила контракт с AMD на поставку HBM3E на сумму $3 млрд 2 ч.
Процессор HiSilicon Kirin 9010 внутри смартфонов Huawei Pura 70 тоже выпускается SMIC по 7-нм технологии 3 ч.
TSMC не потребуется оборудование High-NA EUV для выпуска чипов по технологии A16 4 ч.
Выручка Intel выросла на 9 %, но прогноз на текущий квартал вызвал падение курса акций на 7,75 % 7 ч.
Honor представила смартфон Honor 200 Lite с Dimensity 6080 и 108-Мп камерой 8 ч.