Стартап Илона Маска (Elon Musk) в области искусственного интеллекта X.ai представил обновлённую модель Grok-1.5, которая в ближайшие дни будет подключена к одноимённому чат-боту в соцсети X. Она, как показывают результаты тестов, обладает более продвинутыми техническими характеристиками в сравнении с Grok-1.
Важнейшим преимуществом Grok-1.5 является «улучшенное мышление», и в первую очередь это касается математических задач и написания программного кода. Новая модель более чем вдвое обошла предшественницу в популярном математическом тесте MATH и на 10 п.п. превзошла её в испытании HumanEval на способность генерировать код и решать задачи. Также новинка стала ближе к OpenAI GPT-4 и Google Gemini Pro 1.5.
Трудно предсказать, как это скажется на реальных сценариях: современные чат-боты успешно «сдают» академические экзамены, но их повседневная работа продолжает вызывать справедливые нарекания у рядовых пользователей.
Объективным крупным шагом вперёд является возросший до 128 000 токенов объём воспринимаемого Grok-1.5 контекста. Это значит, что новая модель может обрабатывать более длинные и сложные запросы, сохраняя при этом способность следовать инструкциям по мере расширения контекстного окна. Историческим отличием Grok от большинства прочих моделей генеративного ИИ является возможность поддерживать беседы на закрытые для других чат-ботов темы, такие как теории заговора и неоднозначные политические идеи, а также способность выражаться грубым языком.
В ближайшее время доступ к Grok-1.5 и «нескольким новым функциям» получат участники программы тестирования в соцсети X. Ранее Маск обещал, что чат-бот научится составлять сводки веток обсуждений на платформе и предлагать контент для новых публикаций. Недавно X.ai открыла исходный код Grok-1, хотя и без средств для дальнейшего обучения и тонкой настройки модели. Маск также пообещал, что доступ к чат-боту Grok получат все премиум-подписчики соцсети X, а не только пользователи дорогого тарифа Premium+.