Сегодня 09 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

«Сбер» обновил GigaChat — ИИ-чат-бот получил одну из крупнейших нейросетей на русском языке

В рамках международной конференции по искусственному интеллекту AI Journey разработчики «Сбера» представили новую версию чат-бота GigaChat, основой которого стала одна из самых продвинутых больших языковых моделей (LLM) для русского языка с 29 млрд параметров. В скором времени доступ к API новой версии алгоритма получат бизнес-клиенты «Сбера», что позволит им создавать собственные решения на базе GigaChat, а также участники академического сообщества для проведения исследований.

 Источник изображения: sber.ru

Источник изображения: sber.ru

Использование новой LLM позволяет чат-боту лучше следовать инструкциям и выполнять сложные задания. Существенно повысилась качество суммаризации, рерайтинга, редактирования текстов и ответов на различные вопросы. Разработчики сравнили ответы новой и предыдущей моделей и зафиксировали общее повышение качества на 23 %. В дополнение к этому с фактологией новая модель справляется на 25 % лучше предшественницы.

Для повышения качества работы LLM было проведено множество экспериментов по наращиванию эффективности её обучения. К примеру, использовался фреймворк для обучения больших языковых моделей с возможностью шардирования весов нейросети по видеокартам, за счёт чего удалось сократить потребление памяти на них. Результат внутренней оценки в бенчмарке Massive Multitask Language Understanding показал, что версия GigaChat с 29 млрд параметров превосходит самый популярный открытый аналог LLaMA 2 34B.

«Обучение моделей, лежащих в основе GigaChat, — это масштабный и сложный вычислительный проект, прежде мы не делали ничего подобного. Суммарное количество вычислительных операций почти в 6 раз превысило количество операций при обучении модели ruGPT-3 с 13 млрд параметров в 2021 году. Также специально для GigaChat мы собрали и развиваем уникальный датасет, над которым работают сотни сотрудников «Сбера», помогая развивать и улучшать качество ответов в самых разных доменах. Благодаря этим усилиям пользователи с каждым новым релизом GigaChat получают максимум от сервиса для решения своих задач», — рассказал Андрей Белевцев, старший вице-президент, руководитель блока «Технологии» Сбербанка.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В Steam открылось тестирование Valor Mortis от разработчиков Ghostrunner — ролевого боевика от первого лица в духе Dark Souls и BioShock 7 ч.
Изгнанные Маском без выходного пособия топ-менеджеры Twitter добились «справедливости» через суд 9 ч.
Ninja Gaiden 4, Baldur’s Gate, новая игра от создателей Psychonauts и многое другое: Microsoft раскрыла первые новинки Game Pass после подорожания 10 ч.
«Билайн Big Data & AI» и IVA Technologies займутся совместной разработкой ИИ-продуктов 10 ч.
«Интернет — не свалка для негатива»: в китайских соцсетях массово банят пессимистов 10 ч.
Еврокомиссия выделит €1 млрд на внедрение ИИ в десяти отраслях 11 ч.
Демоны, титаны и невообразимые ужасы: новый геймплейный трейлер Painkiller показал, почему в чистилище веселее с друзьями 11 ч.
Российский рынок IaaS и PaaS отметился 30-проценным ростом с начала года 13 ч.
Beeline Cloud представил комплексное решение для работы с «1С» в защищённом облаке 14 ч.
Разработчик Baldur’s Gate 3 бросил тень на план Илона Маска «сделать игры снова великими» с помощью ИИ 15 ч.
Новая статья: Компьютер месяца — октябрь 2025 года 3 ч.
Новая статья: Обзор робота-уборщика Dreame MatriX10 Ultra: работает за троих 5 ч.
xAI привлёк $20 млрд на покупку ускорителей NVIDIA для Colossus 2 — $2 млрд инвестировала сама NVIDIA 5 ч.
Blue Origin совершила 15-й запуск корабля New Shepard с шестью туристами 5 ч.
Спутниковая группировка Starlink теряет по спутнику в день — они сгорают в атмосфере или падают на Землю 6 ч.
AST SpaceMobile перехватила клиента у Starlink — компания обеспечит видеозвонки через спутник для Verizon 6 ч.
В России стартовали продажи роботов-пылесосов Dreame MatriX10 Ultra и Dreame Aqua10 Ultra Roller Complete 7 ч.
Нобелевскую премию по химии за 2025 года присудили за открытие «домика для молекул» 9 ч.
Sennheiser представила наушники HDB 630 — «первый беспроводной продукт для аудиофилов» 10 ч.
AOC представила 27- и 32-дюймовые игровые мониторы на Fast IPS с разрешением до 4K и частотой до 320 Гц 11 ч.