Поисковик «Яндекса» теперь может рассуждать и генерировать тексты и изображения с помощью «Алисы»

Вместо появившемуся в прошлом году «Поиску с Нейро» в поисковой машине «Яндекса» теперь работает специальная версия «Алисы» — помощника с искусственным интеллектом. Она даёт пользователю в качестве ответа небольшую статью — полноценный структурированный текст, у которого есть подзаголовки, а также иллюстрации в формате изображений и видео.

Источник изображений: «Яндекс»

Также в «Поиске» появился режим рассуждений, который помогает глубже анализировать сложные вопросы — например, рассчитать стоимость строительства двухэтажного дома и составить смету. В таком режиме «Алиса» использует больше источников, проводит более детальный анализ и может представить данные в виде таблиц или наглядных сравнений. Пользователь также может проследить ход её рассуждений. Чтобы включить режим, нужно нажать кнопку «Рассуждать» под ответом.

Ещё «Алиса» теперь умеет создавать тексты и изображения прямо в «Поиске». Можно попросить её придумать заголовок, поздравление или иллюстрацию для презентации — достаточно сформулировать запрос, например: «Напиши пост о плюсах загородной жизни».

«Алиса» поможет сориентироваться при покупке бытовой техники, электроники и товаров для дома. Она объяснит ключевые характеристики и области применения. Чтобы получить советы, нужно нажать «Какие бывают» под поисковой строкой. Например, интересует велотренажёр — «Алиса» расскажет про типы конструкции и нагрузки.

Все пользователи могут попробовать рассуждения и генерацию изображений, но с ограничением по числу запросов. Подписка «Алиса Про» снимает эти ограничения и включает доступ к самой мощной нейросети «Яндекса» — YandexGPT 5 Pro. Также теперь «Алиса» сможет помогать не только в «Поиске», но и на любых сайтах, просматриваемых через «Яндекс Браузер». Функция уже работает на ПК и скоро появится в мобильной версии.

Автономная версия «Нейро», представленная чуть более года назад, работала на базе двух моделей ИИ. Первая, нейросетевая модель-рефазер, обрабатывала вопрос пользователя и производила несколько запросов к поисковой машине. Вторая, модель-генератор, изучала тексты всех страниц из выдачи и формулировала на их основе ответ. Схема оказалась востребованной среди пользователей, но в «Яндексе» остались не удовлетворены качеством ответов на некоторые сложные вопросы.

Поэтому в новом воплощении ИИ-поиска была в корне переработана архитектура сервиса. Модель-рефазер заменили на модель-планер — она выстраивает по выдаче структуру будущего ответа и направляет запросы также в разделы поиска по картинкам и видео; эта модель не только обращается к собственной памяти, но и дополнительно обучается на документах из выдачи.

В качестве модели-генератора использовали нейросеть новейшего семейства YandexGPT 5, которая прошла дополнительное обучение под задачи анализа информации и подготовки сводок. Её отличает более длинное контекстное окно, а также способность работать с разными форматами: текстом, изображениями и видео. На выходе получается связный и подробный структурированный ответ, обогащённый иллюстрациями и ссылками, чтобы пользователь мог более подробно изучить интересующий его вопрос.

Модель-планер обучили определять, каким должен быть ответ на вопросы по разным темам — для этого ей предоставили наборы данных с упором на запросы повышенной сложности, при работе с которыми требуется извлекать и структурировать только нужную информацию. После основного обучения осуществлялось дополнительное — SFT (Supervised Fine-Tuning), а затем обучение с подкреплением, в котором использовались различные методы: CE RL (Cross-Entropy Reinforcement Learning) — генерация нескольких вариантов ответа и выбор лучшего на основе оценки; DPO (Direct Preference Optimization) — выбор лучшего ответа из нескольких, исходя из предпочтений человека; и GRPO (Generalized Reinforcement Preference Optimization) — выбор оптимального ответа с учётом улучшенного понимания контекста и нюансов человеческих предпочтений или усовершенствованный DPO.

При обучении модели-генератора разработчики оптимизировали работу reward-моделей, которые оценивают качество обучаемой — их число довели до 16. Чтобы избежать перекоса генератора в сторону одной из этих моделей вознаграждений, использовали динамические веса на основе знаний о запросах, источниках и плане ответа и провели несколько стадий обучения с подкреплением.

В итоге, подчеркнули в «Яндексе», качество обновлённого ИИ-поиска выросло на 79 % по сравнению с предыдущей версией — сказались более наглядная структура ответа, иллюстрации в виде картинок и видео, а также большее число подробностей в самом тексте.