Сегодня 30 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

«Алиса» получила нейросеть YandexGPT 2 — она отвечает на вопросы лучше старой в 67 % случаев

«Яндекс» представил новую версию большой языковой модели YandexGPT 2 — она уже поддерживается голосовым помощником «Алиса» и отвечает на пользовательские запросы лучше старой в 67 % случаев. Этого удалось добиться за счёт улучшений на каждом этапе обучения модели, главным из которых оказался претрейн (pretrain).

 Источник изображений: ya.ru/gpt/2

Источник изображений: ya.ru/gpt/2

Для сравнения качества работы первой и второй моделей YandexGPT разработчики подготовили набор из 500 пользовательских заданий, которые максимально отличаются друг от друга, предложили их обеим моделям и сравнили результаты — новая оказалась лучше в 67 % случаев. Чтобы конкретизировать критерии, поставленные задачи были поделены на группы, и оценки отдельно провели по каждой из них:

  • генерация текста — YandexGPT 2 победила в 69 % заданий;
  • пересказ и анализ текста — 68 %;
  • «мозговой шторм» идей — 66 %;
  • стилизация текста под аудиторию или конкретного пользователя — 62 %;
  • ответы на вопросы — 62 %.

Обучение моделей производится в два этапа: один называется претрейн (pretrain), второй — файнтюн (finetune). Первый отвечает за сбор фактической информации, второй — за формат и стиль ответа. Эти этапы независимы друг от друга в том смысле, что проблемы одного невозможно исправить на другом. На этапе претрейна ИИ потребляет полезные знания, поэтому разработчикам необходимо правильно набирать их в общий массив — датасет. Обучать модель заново с каждым изменением датасета — слишком трудозатратный и недешёвый процесс. Поэтому переобучение производится, когда накапливается определённая критическая масса обновлений датасета.

Есть и другая проблема: обновлённый датасет может не улучшить, а ухудшить качество работы модели, и контролировать это вручную тоже крайне сложно, потому что чем выше качество датасета, тем труднее обнаруживать его проблемы. Данный процесс решили автоматизировать, производя тестовое обучение маленьких, быстрых моделей, разные версии которых сравниваются по качеству работы. При этом маленькая модель не всегда в полной мере отражает качество большой, поэтому приходится пользоваться дополнительными инструментами:

  • классификатор некачественного текста помог обнаружить проблемы с кодировками, наличие лишних тегов HTML, повторы предложений и другие ошибки;
  • классификатор полезного текста помог обнаружить, отвечает ли материал на конкретный вопрос пользователя;
  • долю текстов с высокой цитируемостью увеличили;
  • долю дублей сократили до значения менее 0,5 %;
  • запустили инструмент для оценки «фактовой полноты» — претрейн обучили давать ответы на 80 % фактовых запросов, с которыми справляется поисковая служба «Яндекса».

Модель YandexGPT 2 уже интегрирована в голосового помощника «Алиса» в навыке «Давай придумаем» в «Яндекс Станциях», умных телевизорах с «Алисой», приложении «Яндекса», в «Яндекс Браузере», а также на поисковых страницах ya.ru. Разработчики модели продолжат совершенствовать датасеты для претрейна и файнтюна. В перспективе планируется внедрение обучения с подкреплением на основе отзывов людей (RLHF — Reinforcement Learning from Human Feedback). Нейросеть появится и в других сервисах «Яндекса», где она может оказаться полезной.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Более четырёх дней длилась самая долгая DDoS-атака на российские ресурсы в 2024 году 4 мин.
Microsoft инвестирует $80 млрд в ИИ, но рост её облачного бизнеса замедлился 2 ч.
Основатель Twitter представил открытую платформу Goose для создания ИИ-агентов 7 ч.
Marvel’s Spider-Man 2 получила системные требования за день до релиза на ПК — для максимальной трассировки лучей понадобится RTX 4090 9 ч.
Sony подтвердила февральскую подборку PS Plus и рассказала, когда перестанет раздавать игры для PS4 10 ч.
Windows 11 научилась показывать сообщения и другие данные с iPhone прямо в меню «Пуск» 10 ч.
Привязка аккаунта PSN станет необязательной в играх Sony на ПК, но пока лишь в четырёх 12 ч.
Microsoft исправила проблемы с наушниками и веб-камерами, которые вызвало недавнее обновление Windows 11 12 ч.
DeepSeek пропал из App Store и Google Play в Италии — до этого власти решили выяснить, как сервис обрабатывает персональные данные 13 ч.
Датамайнер раскрыл, когда выйдут перевыпуски классических The Sims и чего от них ждать 14 ч.
Tesla запустит беспилотные такси в столице Техаса в июне на коммерческой основе 27 мин.
Эпидемия «синих треугольников смерти» поразила смарт-часы Garmin — устройства выходят из строя по всему миру 2 ч.
По итогам квартала Tesla сократила чистую прибыль на 70 %, но готовит более доступные электромобили 3 ч.
Nvidia раскрыла полные спецификации графических чипов GB203 и GB205 видеокарт GeForce RTX 5070 Ti и RTX 5070 7 ч.
TikTok потратит $3,8 млрд на ЦОД и облако в Таиланде 8 ч.
Новая статья: Лучшие ИИ-сервисы по версии 3DNews. Часть 1: ИИ-собеседники, генераторы картинок и видео, поисковики 8 ч.
Radeon RX 7900 XTX обогнала GeForce RTX 4090 в работе с ИИ-моделью DeepSeek R1 8 ч.
В образцах с астероида Бенну обнаружены почти всё «кирпичики» для зарождения жизни 9 ч.
Китайский робопёс на колёсиках Lynx показал чудеса ловкости и гибкости при движении по воде и пересечённой местности 11 ч.
NREL протестирует подземные хранилища холода Cold UTES для ЦОД 13 ч.