Сегодня 30 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → yandexgpt 3 lite

«Яндекс» выпустила ИИ-модель YandexGPT 5 Lite — она поможет ускорить IT-разработку и исследования

Компания «Яндекс» открыла доступ к Instruct-версии обновлённой языковой модели YandexGPT 5 Lite, которую можно использовать как в некоммерческих, так и в коммерческих целях. Алгоритм будет полезен для разных людей, например, для разработчиков и исследователей, поскольку его можно сразу внедрить в собственный проект.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

ИИ-модель не слишком требовательна к вычислительным ресурсам, поэтому её можно протестировать на собственном компьютере без необходимости использования дополнительного оборудования. Отмечается, что помимо предварительного обучения ИИ-модель прошла дополнительный этап настройки, благодаря чему она способна выполнять конкретные задачи по промптам (пользовательским инструкциям или запросам). Другая версия YandexGPT 5 Lite (Pretrain) не проходила этот этап, поэтому пользователям придётся дообучать её под свои задачи самостоятельно.

Результаты тестирования YandexGPT 5 Lite Instruct указывают на то, что алгоритм близок по результатам к китайской нейросети Qwen2.5-7B-Instruct и превосходит её при выполнении задач классификации и разметки текстов, в знании русской культуры и фактов, умении отвечать в заданном формате. Замеры «Яндекса» методом слепого сравнения (Side by Side) показали, что YandexGPT 5 Lite в 62 % случаев превосходит Qwen2.5-7B-Instruct и по качеству ответов сравнима с GPT-4o Mini в решении стандартных задач сервисов «Яндекса».

Вместе с этим была обновлена лицензия ИИ-модели, теперь её можно задействовать в любых целях, в том числе в коммерческих (при условии, что объём выходных токенов не превышает 10 млн в месяц). В компании считают, что такого объёма достаточно для чат-ботов на небольших и средних сайтах, генерации описаний товаров в интернет-магазинах с ограниченным ассортиментом, автоматизации ответов клиентам в сервисных центрах и др.

Модель YandexGPT 5 Lite включает 8 млрд параметров и поддерживает контекст до 32 тыс. токенов. По данным разработчиков, компактность и качество алгоритма, совместимость с библиотекой llama.cpp и поддержка формата GPT-Generated Unified Format делают возможным запуск ИИ-модели даже на персональных компьютерах. Разработчикам и исследователям Instruct-версия модели доступна на Hugging Face, а простые пользователи могут протестировать алгоритм в чате с «Алисой» (доступно 5 бесплатных запросов в день). Для бизнеса ИИ-модель доступна через соответствующий API в Yandex Cloud.

«Яндекс» запустил генеративную нейросеть YandexGPT Lite третьего поколения

Компания «Яндекс» официально представила облегчённую версию своей генеративной нейросети третьего поколения YandexGPT 3 Lite. ИИ-сервис доступен клиентам облачной платформы Yandex Cloud через соответствующий API. Нейросеть может быть полезна для разных сценариев использования, например, в чат-ботах, для проверки орфографии или анализа данных.

 Источник изображения: «Яндекс»

Источник изображения: «Яндекс»

В компании отметили, что новая версия нейросети подходит для применения в разных сегментах бизнеса. Использование YandexGPT 3 Lite позволит оптимизировать процесс выполнения разных задач, включая консультирование клиентов по телефону и в чатах, подготовку ответов для служб поддержки, генерацию маркетинговых материалов и др. В крупных организациях со сложными бизнес-процессами и большими потоками данных ИИ-сервис может оказаться полезным для анализа информации.

По словам разработчиков «Яндекса», YandexGPT 3 Lite по многим параметрам превосходит ИИ-модель предыдущего поколения. В ходе тестирования языковой модели в YaMMLU_ru (русскоязычная версия международного эталонного теста MMLU) было установлено, что YandexGPT 3 Lite даёт на 6 % больше верных ответов, чем модель YandexGPT 2 Lite.

Алгоритмы также сравнивались по методу Side by Side, когда им приходится отвечать на одинаковые вопросы, а лучший ответ выбирается экспертной группой. В результате было установлено, что YandexGPT 3 Lite отвечает лучше в 68 % случаев. Ещё в ходе тестирования специалисты оценили, насколько хорошо YandexGPT 3 Lite справляется с задачами классификации, генерации контента, ответами на вопросы и др. Также упоминается, что новый алгоритм допускает меньше орфографических и фактических ошибок по сравнению с YandexGPT 2 Lite.

В процессе создания новой ИИ-модели разработчики усовершенствовали все этапы обучения. Был улучшен отбор данных для предварительного этапа обучения, за счёт чего увеличилась доля полезной информации. Также была задействована технология Curriculum Learning для поэтапного усложнения данных. На втором этапе обучения, включающем в себя обучение с подкреплением, была улучшена модель для оценки качества ответов алгоритма. В дополнение к этому в архитектуре нейросети появилась технология Grouped Query Attention для ускорения обработки данных без потери качества.

Стоимость использования YandexGPT 3 Lite составляет 20 копеек за 1000 токенов. Новые пользователи Yandex Cloud смогут бесплатно протестировать ИИ-сервис в демо-режиме. Новая модель заменит предыдущую версию алгоритма в течение месяца.


window-new
Soft
Hard
Тренды 🔥
«Горячие» обновления для локальных Windows Server 2025 станут платными 41 мин.
Актриса озвучки Йеннифэр из The Witcher 3: Wild Hunt «ничего не знает» о возможном возвращении чародейки в «Ведьмаке 4» 2 ч.
Доминирование Google пошатнулось — его доля на мировом рынке поиска скатилась ниже 90 % впервые за десять лет 2 ч.
Intel раскрыла потенциал встроенной графики Core Ultra 200V — свежий драйвер повысил FPS на 10 % и не только 3 ч.
«Яндекс Маркет» обзавёлся чат-ботом на мощнейшем ИИ «Яндекса» — он поможет выбрать покупки 3 ч.
Футуристический шутер La Quimera от бывших разработчиков Metro пройдёт через ранний доступ Steam, чтобы стать «большой и цельной» игрой 3 ч.
Xiaomi выпустила открытую рассуждающую ИИ-модель MiMo и заявила, что она быстрее OpenAI o1-mini 4 ч.
Глава Gearbox опроверг, что Borderlands 4 перенесли ради GTA VI или «любого другого продукта» 4 ч.
Релиз амбициозного китайского боевика Lost Soul Aside отложили на три месяца — объявлена новая дата выхода 6 ч.
Криптобиржу Grinex заподозрили в связях с заблокированной российской биржей Garantex 7 ч.
InWin представила вместительный компьютерный корпус PRISM весом 10 кг с четырьмя вентиляторами 40 мин.
В Можайском округе построят очередной ЦОД «Яндекса» 2 ч.
Dell представила ноутбуки Dell 16 Plus с чипами AMD Ryzen AI 300 по цене от $850 2 ч.
Экипаж «Шэньчжоу-19» приземлился после шести месяцев космической вахты на станции «Тяньгун» 2 ч.
Электролёт Joby Aviation впервые с пилотом на борту полетал в режимах вертолёта и самолёта 2 ч.
Innodisk выпустила 128-Тбайт E3.L SSD с интерфейсом PCIe 5.0 4 ч.
Nvidia опровергла слухи о намерениях создать совместное предприятие в Китае 4 ч.
У Apple произошли перестановки в музыкальном и международном отделах 4 ч.
США собрались пересмотреть экспортные ограничения на ИИ-чипы, но вряд ли остальным странам станет от этого лучше 5 ч.
AWS построит в Индиане дата-центр, который будет потреблять энергии как половина населения штата 7 ч.