Сегодня 26 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

«Алиса» получила нейросеть YandexGPT 2 — она отвечает на вопросы лучше старой в 67 % случаев

«Яндекс» представил новую версию большой языковой модели YandexGPT 2 — она уже поддерживается голосовым помощником «Алиса» и отвечает на пользовательские запросы лучше старой в 67 % случаев. Этого удалось добиться за счёт улучшений на каждом этапе обучения модели, главным из которых оказался претрейн (pretrain).

 Источник изображений: ya.ru/gpt/2

Источник изображений: ya.ru/gpt/2

Для сравнения качества работы первой и второй моделей YandexGPT разработчики подготовили набор из 500 пользовательских заданий, которые максимально отличаются друг от друга, предложили их обеим моделям и сравнили результаты — новая оказалась лучше в 67 % случаев. Чтобы конкретизировать критерии, поставленные задачи были поделены на группы, и оценки отдельно провели по каждой из них:

  • генерация текста — YandexGPT 2 победила в 69 % заданий;
  • пересказ и анализ текста — 68 %;
  • «мозговой шторм» идей — 66 %;
  • стилизация текста под аудиторию или конкретного пользователя — 62 %;
  • ответы на вопросы — 62 %.

Обучение моделей производится в два этапа: один называется претрейн (pretrain), второй — файнтюн (finetune). Первый отвечает за сбор фактической информации, второй — за формат и стиль ответа. Эти этапы независимы друг от друга в том смысле, что проблемы одного невозможно исправить на другом. На этапе претрейна ИИ потребляет полезные знания, поэтому разработчикам необходимо правильно набирать их в общий массив — датасет. Обучать модель заново с каждым изменением датасета — слишком трудозатратный и недешёвый процесс. Поэтому переобучение производится, когда накапливается определённая критическая масса обновлений датасета.

Есть и другая проблема: обновлённый датасет может не улучшить, а ухудшить качество работы модели, и контролировать это вручную тоже крайне сложно, потому что чем выше качество датасета, тем труднее обнаруживать его проблемы. Данный процесс решили автоматизировать, производя тестовое обучение маленьких, быстрых моделей, разные версии которых сравниваются по качеству работы. При этом маленькая модель не всегда в полной мере отражает качество большой, поэтому приходится пользоваться дополнительными инструментами:

  • классификатор некачественного текста помог обнаружить проблемы с кодировками, наличие лишних тегов HTML, повторы предложений и другие ошибки;
  • классификатор полезного текста помог обнаружить, отвечает ли материал на конкретный вопрос пользователя;
  • долю текстов с высокой цитируемостью увеличили;
  • долю дублей сократили до значения менее 0,5 %;
  • запустили инструмент для оценки «фактовой полноты» — претрейн обучили давать ответы на 80 % фактовых запросов, с которыми справляется поисковая служба «Яндекса».

Модель YandexGPT 2 уже интегрирована в голосового помощника «Алиса» в навыке «Давай придумаем» в «Яндекс Станциях», умных телевизорах с «Алисой», приложении «Яндекса», в «Яндекс Браузере», а также на поисковых страницах ya.ru. Разработчики модели продолжат совершенствовать датасеты для претрейна и файнтюна. В перспективе планируется внедрение обучения с подкреплением на основе отзывов людей (RLHF — Reinforcement Learning from Human Feedback). Нейросеть появится и в других сервисах «Яндекса», где она может оказаться полезной.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Российская «дочка» Microsoft подала заявление о банкротстве 4 ч.
GPT-5 обещает серьёзный прогресс в практическом программировании и разработке ПО 11 ч.
Microsoft назвала Windows 11 24H2 самой стабильной за всю историю, что бы это ни значило 11 ч.
Новая статья: Tony Hawk’s Pro Skater 3 + 4 — кажется, вы что-то забыли. Рецензия 11 ч.
ВТБ провёл крупнейшее в России импортозамещение системы управления знаниями 12 ч.
Plants vs. Zombies Replanted скоро выйдет из тени — инсайдер раскрыл дату выхода переиздания культовой игры о противостоянии растений и зомби 12 ч.
Вышел релиз обновлённого «Кибер Хранилища» с массой оптимизаций для работы с кластерами S3 13 ч.
Microsoft рассказала, что ждёт Copilot в будущем: ИИ будет «жить», «стареть» и получит собственную комнату 14 ч.
«История про убийство нацистов всегда в моде»: Amazon запустила в производство сериал по Wolfenstein 14 ч.
Как много чемпионов: Bethesda похвасталась новыми успехами The Elder Scrolls IV: Oblivion Remastered 15 ч.
Американские регуляторы прекратили расследование в отношении аномального поведения беспилотных такси Waymo 4 ч.
В Калифорнии роботакси Tesla превратятся в обычные, поскольку за рулём потребуется водитель 5 ч.
Intel подыщет для сетевого подразделения внешних инвесторов 6 ч.
Потенциальный отказ Intel от передовой литографии вызвал обвал акций компании на 8 % 6 ч.
Проект Tesla Optimus сталкивается с проблемами и отстаёт от графика, но Маск и инвесторы сохраняют оптимизм 10 ч.
Несмотря на запреты США в Китай «просочились» передовые ускорители NVIDIA на $1 млрд 10 ч.
Смарт-часы под брендом Pebble снова появятся на рынке 11 ч.
DJI готовится к выходу на рынок роботов-пылесосов — первый продукт уже готов 11 ч.
SK Hynix запустит производство чипов GDDR7 ёмкостью 3 Гбайт — идеально для GeForce RTX 50 Super 11 ч.
Lian Li выпустила компактный корпус-аквариум O11D MINI V2 с поддержкой массивных видеокарт 14 ч.