Новости Software

«Яндекс» представил YaLM 100B — самую большую открытую нейросеть для генерации текстов

Компания «Яндекс» анонсировала нейросеть YaLM 100B, предназначенную для генерации и обработки текстов на русском и английском языках. Утверждается, что на сегодняшний день это самая большая в мире GPT-подобная (Generative Pre-trained Transformer) модель, опубликованная в свободном доступе.

 Источник изображений: pixabay.com / geralt

Источник изображений: pixabay.com / geralt

YaLM 100В содержит 100 млрд параметров — больше, чем какая-либо из существующих моделей для русского языка. Благодаря этому нейросеть можно применять для решения широкого круга задач, связанных с обработкой естественного языка.

Языковые модели семейства YaLM определяют принцип построения текстов и генерируют новые, опираясь на законы лингвистики и свои знания о мире. Допускается формирование текстов любого типа: это могут быть ответы, стихи, поздравления и пр. Более того, алгоритмы способны придумывать идеи для рекламных кампаний, создавать описания товаров и видео, а также классифицировать тексты.

 Источник изображения: pixabay.com / Gerd Altmann

Источник изображения: pixabay.com / Gerd Altmann

В процессе обучения сети были задействованы суперкомпьютеры «Яндекса», признанные самыми мощными в Восточной Европе. YaLM 100B обработала около 2 Тбайт текстов из открытых источников и интернета на английском и русском языках.

Теперь нейросеть могут использовать разработчики и исследователи со всего мира. Модель предоставляется по открытой лицензии Apache 2.0 и доступна на GitHub.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Microsoft отключила русскоязычную версию блога Xbox Wire 3 ч.
Ubisoft закроет 1 сентября серверы многих игр, включая Far Cry 3, Anno 2070 и несколько Assassin's Creed 7 ч.
В Dying Light 2 появилась неофициальная поддержка масштабирования AMD FSR 2.0 7 ч.
EA раскритиковали за попытку пошутить над людьми, которым «нравятся только одиночные игры» 7 ч.
Windows 11 становится всё популярнее среди геймеров — в Steam эта ОС заняла более 20 % в июле 10 ч.
Новая статья: Neon White — неожиданный кандидат на «Игру года». Рецензия 21 ч.
Новая статья: Gamesblender № 577: цена прокачки в Diablo Immortal, Overwatch 2 вместо первой части и поиски виновных в багах Cyberpunk 2077 22 ч.
Meta закроет свой неудавшийся криптопроект Novi в сентябре 02-07 17:02
У витрины инди-игр itch.io появился клон — W3itch.io: его создатели признались в воровстве чужого кода 02-07 16:04
Первые подробности кампании Бакалавра в «Мор. Утопия»: без выживания и открытого мира, но с путешествием во времени 02-07 15:52
Дата-центрам Microsoft Azure не хватает серверов в условиях облачного бума 4 мин.
Марсоход Perseverance получил повреждения датчика ветра — из-за слишком сильного ветра 4 ч.
Ericsson: объём мобильного веб-трафика удвоился за два года и продолжит расти — инфраструктура может не справиться 7 ч.
Intel будет терять позиции на серверном рынке: AMD увеличит долю в 1,8 раз, а системы на Arm — более чем в 3 раза 8 ч.
Немецкий регулятор призвал Tesla отозвать почти 60 тыс. Model Y и Model 3 9 ч.
OnePlus готовит свои самые доступные беспроводные наушники — Nord Buds CE 13 ч.
Fractal Design представила корпуса серии Pop XL с поддержкой видеокарт длиной до 455 мм 13 ч.
В июньском рейтинге самых мощных смартфонов доминируют аппараты на базе Snapdragon 8 Gen 1 14 ч.
Tesla построит в Техасе ещё один гигантский производственный корпус 14 ч.
Завершён третий этап изоляционного эксперимента SIRIUS: экипаж «побывал» на Луне 15 ч.