Сегодня 25 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Яндекс представил третье поколение нейросетей YandexGPT

Компания «Яндекс» представила семейство больших языковых моделей нового поколения YandexGPT 3; пользователи Yandex Cloud уже могут поработать с одной из них — YandexGPT 3 Pro. Она лучше подходит для бизнес-пользователей, поскольку эффективнее обрабатывает сложные запросы и может следовать заданному формату ответов на них. При необходимости можно дополнительно обучить YandexGPT 3 самостоятельно. В ближайшее время нейросети нового поколения появятся в сервисах «Яндекса» для широкого круга пользователей.

 Источник изображений: yandex.ru/company

Источник изображений: yandex.ru/company

YandexGPT 3 Pro демонстрирует особые успехи в сферах клиентской поддержки, онлайн-продаж, цифровых коммуникаций, рекламы и управления персоналом. Она может самостоятельно создавать договоры, счета, должностные инструкции, нормативную и прочую документацию. YandexGPT 3 Pro значительно продвинулась вперёд относительно YandexGPT 2: новая нейросеть корректно обрабатывает инструкции с несколькими условиями, её ответы стали точнее и полнее, работа с фактами — более тщательной, а процент стилистических ошибок снизился.

«Яндекс» использовал несколько тестов, чтобы оценить работу YandexGPT 3 Pro. Была разработана русскоязычная версия международного бенчмарка MMLU — ему дали название YaMMLU_ru. Чтобы оценить работу ИИ-модели в задачах по генерации идей, обобщению данных, классификации и генерации контента, использовалась методика тестирования Side by Side (SBS). YandexGPT 3 в 69 % случаев давала более качественные ответы на пользовательские запросы, чем YandexGPT 2; в бизнес-запросах она стала лучше в 60 % случаев.

Качество ответов в рамках заданного формата проверялось с помощью русскоязычного теста на основе бенчмарка IFEval: у YandexGPT 3 оно по сравнению с YandexGPT 2 выросло на 10 п.п., а консистентность удвоилась — это значит, что модель нового поколения стала лучше понимать, как отвечать на одинаковые по содержанию, но разные по форме запросы.

Наконец, число фактических ошибок YandexGPT 3 сократилось с 16,4 % до 13,5 %, а доля неподтверждённой информации упала с 6,4 % до 5 %. В 5 раз сократилось число отказов отвечать на запросы. Эти испытания разработчики провели на особо сложных запросах, которые могут возникнуть в реальных сценариях.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Если научить ИИ маленькому обману, он начнёт жульничать систематически — Anthropic открыла вредную склонность ИИ 19 мин.
Утечка: российские фанаты «Принца Персии» опубликовали запись внутреннего показа ремейка Prince of Persia: The Sands of Time 35 мин.
В «Яндекс Картах» появился ИИ-помощник — он даёт подробные и актуальные подсказки 3 ч.
Google отчаянно защищает AdX от принудительной продажи: отделить рекламный бизнес технически невозможно 5 ч.
Ошибка Windows 11 24H2 приводит к сбоям в «Проводнике» и меню «Пуск» 6 ч.
ИИ оказался слишком рискованным даже для страхования от рисков 9 ч.
Anthropic бросает вызов Gemini 3: представлена мощная ИИ-модель Opus 4.5 и инструмент для покорения Excel 13 ч.
Маск ударил по фабрикам троллей: X начала показывать местоположение аккаунтов 14 ч.
Календарь релизов 24 – 30 ноября: Of Ash and Steel, Project Motor Racing и Hail to the Rainbow 15 ч.
В Steam стартовала распродажа «Чёрная пятница» и голосование за лучшие игры 2025 года 15 ч.
Китай запустил первую в своей истории спасательную космическую миссию 6 мин.
Российскому интернету грозит «помутнение»: до 70 % оптоволоконных магистралей устареют в 2025 году 8 мин.
Xiaomi научила электромобили автоматически объезжать препятствия в случае опасности 23 мин.
TSMC построит на Тайване ещё три фабрики 2-нм чипов и ускорит освоение этого техпроцесса в США 38 мин.
Microsoft представила настоящие кроксы в стиле Xbox — и их даже можно купить 2 ч.
Российские магистральные ВОЛС близки к предельному возрасту эксплуатации 2 ч.
Приемлемо: Samsung наконец довела 2-нм техпроцесс до уровня брака ниже 50 % 2 ч.
Стартап Kneron представил чип KL1140 для работы с ИИ-моделями на периферии 3 ч.
В Швейцарии создали крошечного робота-курьера для адресной доставки лекарств по венам 3 ч.
«Они его не хотят!»: Маск признал, что автопилот Tesla оказался не нужен другим автопроизводителям 3 ч.