Сегодня 30 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → yandexgpt 3 lite

«Яндекс» выпустила ИИ-модель YandexGPT 5 Lite — она поможет ускорить IT-разработку и исследования

Компания «Яндекс» открыла доступ к Instruct-версии обновлённой языковой модели YandexGPT 5 Lite, которую можно использовать как в некоммерческих, так и в коммерческих целях. Алгоритм будет полезен для разных людей, например, для разработчиков и исследователей, поскольку его можно сразу внедрить в собственный проект.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

ИИ-модель не слишком требовательна к вычислительным ресурсам, поэтому её можно протестировать на собственном компьютере без необходимости использования дополнительного оборудования. Отмечается, что помимо предварительного обучения ИИ-модель прошла дополнительный этап настройки, благодаря чему она способна выполнять конкретные задачи по промптам (пользовательским инструкциям или запросам). Другая версия YandexGPT 5 Lite (Pretrain) не проходила этот этап, поэтому пользователям придётся дообучать её под свои задачи самостоятельно.

Результаты тестирования YandexGPT 5 Lite Instruct указывают на то, что алгоритм близок по результатам к китайской нейросети Qwen2.5-7B-Instruct и превосходит её при выполнении задач классификации и разметки текстов, в знании русской культуры и фактов, умении отвечать в заданном формате. Замеры «Яндекса» методом слепого сравнения (Side by Side) показали, что YandexGPT 5 Lite в 62 % случаев превосходит Qwen2.5-7B-Instruct и по качеству ответов сравнима с GPT-4o Mini в решении стандартных задач сервисов «Яндекса».

Вместе с этим была обновлена лицензия ИИ-модели, теперь её можно задействовать в любых целях, в том числе в коммерческих (при условии, что объём выходных токенов не превышает 10 млн в месяц). В компании считают, что такого объёма достаточно для чат-ботов на небольших и средних сайтах, генерации описаний товаров в интернет-магазинах с ограниченным ассортиментом, автоматизации ответов клиентам в сервисных центрах и др.

Модель YandexGPT 5 Lite включает 8 млрд параметров и поддерживает контекст до 32 тыс. токенов. По данным разработчиков, компактность и качество алгоритма, совместимость с библиотекой llama.cpp и поддержка формата GPT-Generated Unified Format делают возможным запуск ИИ-модели даже на персональных компьютерах. Разработчикам и исследователям Instruct-версия модели доступна на Hugging Face, а простые пользователи могут протестировать алгоритм в чате с «Алисой» (доступно 5 бесплатных запросов в день). Для бизнеса ИИ-модель доступна через соответствующий API в Yandex Cloud.

«Яндекс» запустил генеративную нейросеть YandexGPT Lite третьего поколения

Компания «Яндекс» официально представила облегчённую версию своей генеративной нейросети третьего поколения YandexGPT 3 Lite. ИИ-сервис доступен клиентам облачной платформы Yandex Cloud через соответствующий API. Нейросеть может быть полезна для разных сценариев использования, например, в чат-ботах, для проверки орфографии или анализа данных.

 Источник изображения: «Яндекс»

Источник изображения: «Яндекс»

В компании отметили, что новая версия нейросети подходит для применения в разных сегментах бизнеса. Использование YandexGPT 3 Lite позволит оптимизировать процесс выполнения разных задач, включая консультирование клиентов по телефону и в чатах, подготовку ответов для служб поддержки, генерацию маркетинговых материалов и др. В крупных организациях со сложными бизнес-процессами и большими потоками данных ИИ-сервис может оказаться полезным для анализа информации.

По словам разработчиков «Яндекса», YandexGPT 3 Lite по многим параметрам превосходит ИИ-модель предыдущего поколения. В ходе тестирования языковой модели в YaMMLU_ru (русскоязычная версия международного эталонного теста MMLU) было установлено, что YandexGPT 3 Lite даёт на 6 % больше верных ответов, чем модель YandexGPT 2 Lite.

Алгоритмы также сравнивались по методу Side by Side, когда им приходится отвечать на одинаковые вопросы, а лучший ответ выбирается экспертной группой. В результате было установлено, что YandexGPT 3 Lite отвечает лучше в 68 % случаев. Ещё в ходе тестирования специалисты оценили, насколько хорошо YandexGPT 3 Lite справляется с задачами классификации, генерации контента, ответами на вопросы и др. Также упоминается, что новый алгоритм допускает меньше орфографических и фактических ошибок по сравнению с YandexGPT 2 Lite.

В процессе создания новой ИИ-модели разработчики усовершенствовали все этапы обучения. Был улучшен отбор данных для предварительного этапа обучения, за счёт чего увеличилась доля полезной информации. Также была задействована технология Curriculum Learning для поэтапного усложнения данных. На втором этапе обучения, включающем в себя обучение с подкреплением, была улучшена модель для оценки качества ответов алгоритма. В дополнение к этому в архитектуре нейросети появилась технология Grouped Query Attention для ускорения обработки данных без потери качества.

Стоимость использования YandexGPT 3 Lite составляет 20 копеек за 1000 токенов. Новые пользователи Yandex Cloud смогут бесплатно протестировать ИИ-сервис в демо-режиме. Новая модель заменит предыдущую версию алгоритма в течение месяца.


window-new
Soft
Hard
Тренды 🔥
Релиз амбициозного китайского боевика Lost Soul Aside отложили на три месяца — объявлена новая дата выхода 33 мин.
Криптобиржу Grinex заподозрили в связях с заблокированной российской биржей Garantex 2 ч.
Reddit заблокировала учёных за тайный эксперимент с ИИ-ботами в дискуссиях 5 ч.
OpenAI откатила обновление ChatGPT из-за подхалимского поведения ИИ 5 ч.
Mozilla Firefox представила долгожданную функцию разделения профилей, как в Chrome 6 ч.
Маск объявил скорый выход Grok 3.5 — размышляющего ИИ, который будет «создавать ответы с нуля» без интернета 11 ч.
Московский суд оштрафовал Blizzard на 600 тысяч рублей за нарушение правил работы в России 12 ч.
Electronic Arts отменила эвакуационный шутер по Titanfall и устроила новую волну сокращений в Respawn 12 ч.
Meta похвасталась, что число загрузок ИИ-моделей Llama перевалило за 1,2 млрд 12 ч.
ИИ-блокнот Google NotebookLM заговорил на русском и ещё более чем 50 языках 13 ч.
AWS построит в Индиане дата-центр, который будет потреблять энергии как половина населения штата 2 ч.
Выручка Seagate выросла на 31 % и превзошла ожидания аналитиков 3 ч.
Ракета Firefly Alpha доставила спутник в Тихий океан вместо орбиты — всему виной загадочный сбой 3 ч.
Прибыль Samsung в полупроводниковом секторе упала на 42 % из-за санкций и низких цен 4 ч.
TSMC приступила к строительству третьего предприятия в штате Аризона 5 ч.
Новая статья: Гид по выбору складного смартфона в 2025 году 11 ч.
Inventec вложит до $85 млн в производство серверов в Техасе 12 ч.
Европейская ракета Vega-C вывела в космос научный спутник ESA Biomass для подсчёта лесов на планете 12 ч.
SilverStone выпустила блок питания мощностью 2500 Вт, которых хватит на трио RTX 5090 или квартет RTX 5080 13 ч.
Одних лишь фабрик чипов недостаточно: на создание полноценной цепочки поставок в США у TSMC уйдёт до 10 лет 16 ч.