Сегодня 08 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

«Яндекс» представил YaLM 100B — самую большую открытую нейросеть для генерации текстов

Компания «Яндекс» анонсировала нейросеть YaLM 100B, предназначенную для генерации и обработки текстов на русском и английском языках. Утверждается, что на сегодняшний день это самая большая в мире GPT-подобная (Generative Pre-trained Transformer) модель, опубликованная в свободном доступе.

 Источник изображений: pixabay.com / geralt

Источник изображений: pixabay.com / geralt

YaLM 100В содержит 100 млрд параметров — больше, чем какая-либо из существующих моделей для русского языка. Благодаря этому нейросеть можно применять для решения широкого круга задач, связанных с обработкой естественного языка.

Языковые модели семейства YaLM определяют принцип построения текстов и генерируют новые, опираясь на законы лингвистики и свои знания о мире. Допускается формирование текстов любого типа: это могут быть ответы, стихи, поздравления и пр. Более того, алгоритмы способны придумывать идеи для рекламных кампаний, создавать описания товаров и видео, а также классифицировать тексты.

 Источник изображения: pixabay.com / Gerd Altmann

Источник изображения: pixabay.com / Gerd Altmann

В процессе обучения сети были задействованы суперкомпьютеры «Яндекса», признанные самыми мощными в Восточной Европе. YaLM 100B обработала около 2 Тбайт текстов из открытых источников и интернета на английском и русском языках.

Теперь нейросеть могут использовать разработчики и исследователи со всего мира. Модель предоставляется по открытой лицензии Apache 2.0 и доступна на GitHub.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Stack Overflow передаст свой контент для обучения ChatGPT, хотят того пользователи или нет 48 мин.
Готический шутер Trench Tales в эстетике Первой и Второй мировых войн от художника Prey появился на Kickstarter 3 ч.
Скандальная криптобиржа FTX вернёт средства почти всем клиентам — даже с процентами 3 ч.
Путин поручил поставить на контроль образ России в видеоиграх 5 ч.
ФСТЭК России разработала методику оценки защищённости объектов критической информационной инфраструктуры 6 ч.
Слухи: майская презентация PlayStation Showcase реальна и «может пройти в любой момент» 6 ч.
Посты в Threads можно будет публиковать прямо из Instagram 7 ч.
Акции Reddit резко выросли на 14 % после публикации квартального отчета 8 ч.
Через год сегодняшний ChatGPT будет выглядеть смехотворно плохо, заявил директор OpenAI 8 ч.
«Ещё одна грандиозная игра-сервис»: гендиректор EA «как никогда воодушевлён» новой Battlefield 8 ч.
В Исландии запущено крупнейшее в мире предприятие по прямому удалению углекислого газа из атмосферы 2 ч.
SoftBank не прочь приобрести тонущего разработчика ИИ-чипов Graphcore 2 ч.
Беспилотные грузовики Daimler появятся на дорогах общего пользования в 2027 году 3 ч.
Apple продаст всего 4,5–5 млн новых iPad Pro в этом году, а OLED-дисплеи скоро подешевеют, считают аналитики 3 ч.
Россияне смогут купить новые iPad Pro и Air в день старта мировых продаж, но цена достигнет 500 тыс. рублей 3 ч.
Intel выпустила окончательную инструкцию по правильной настройке BIOS для Raptor Lake — производители плат всё делали неправильно 4 ч.
Американский ИИ-стартап Iozera намерен построить в Марокко 386-МВт дата-центр 4 ч.
Одноплатный компьютер GigaIPC PICO-N97A на базе Intel Alder Lake-N выполнен в формате Pico-ITX 4 ч.
Рурский университет предложил сохранять тепло ЦОД в заброшенной шахте, чтобы зимой использовать его для отопления домов 4 ч.
«Ситилинк» уволил сотни сотрудников на фоне падения выручки и прибыли 6 ч.