Сегодня 22 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

«Сбер» обновил GigaChat — ИИ-чат-бот получил одну из крупнейших нейросетей на русском языке

В рамках международной конференции по искусственному интеллекту AI Journey разработчики «Сбера» представили новую версию чат-бота GigaChat, основой которого стала одна из самых продвинутых больших языковых моделей (LLM) для русского языка с 29 млрд параметров. В скором времени доступ к API новой версии алгоритма получат бизнес-клиенты «Сбера», что позволит им создавать собственные решения на базе GigaChat, а также участники академического сообщества для проведения исследований.

 Источник изображения: sber.ru

Источник изображения: sber.ru

Использование новой LLM позволяет чат-боту лучше следовать инструкциям и выполнять сложные задания. Существенно повысилась качество суммаризации, рерайтинга, редактирования текстов и ответов на различные вопросы. Разработчики сравнили ответы новой и предыдущей моделей и зафиксировали общее повышение качества на 23 %. В дополнение к этому с фактологией новая модель справляется на 25 % лучше предшественницы.

Для повышения качества работы LLM было проведено множество экспериментов по наращиванию эффективности её обучения. К примеру, использовался фреймворк для обучения больших языковых моделей с возможностью шардирования весов нейросети по видеокартам, за счёт чего удалось сократить потребление памяти на них. Результат внутренней оценки в бенчмарке Massive Multitask Language Understanding показал, что версия GigaChat с 29 млрд параметров превосходит самый популярный открытый аналог LLaMA 2 34B.

«Обучение моделей, лежащих в основе GigaChat, — это масштабный и сложный вычислительный проект, прежде мы не делали ничего подобного. Суммарное количество вычислительных операций почти в 6 раз превысило количество операций при обучении модели ruGPT-3 с 13 млрд параметров в 2021 году. Также специально для GigaChat мы собрали и развиваем уникальный датасет, над которым работают сотни сотрудников «Сбера», помогая развивать и улучшать качество ответов в самых разных доменах. Благодаря этим усилиям пользователи с каждым новым релизом GigaChat получают максимум от сервиса для решения своих задач», — рассказал Андрей Белевцев, старший вице-президент, руководитель блока «Технологии» Сбербанка.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Превращает мечту в реальность»: эксперта Digital Foundry впечатлила работа Bloodborne на ПК через эмулятор shadPS4 54 мин.
Google вложит ещё $1 млрд в конкурента OpenAI — ИИ-стартап Anthropic 2 ч.
Трамп помиловал основателя даркнет-платформы Silk Road, осуждённого на пожизненный срок 2 ч.
Регулирование криптовалют станет простым и понятным — сторонники Трампа запустили глубинные изменения в SEC 2 ч.
Аналитики подсчитали траты российских геймеров на игры в 2024 году и назвали главные хиты продаж 2 ч.
Журналисты случайно «засветили» дату выхода Doom: The Dark Ages, которую анонсируют на Developer_Direct 3 ч.
Аудитория Netflix взлетела до 302 млн благодаря «Игре в кальмара» — сервис поднял цены на подписку 3 ч.
Microsoft разрешила OpenAI пользоваться облачными сервисами конкурентов 7 ч.
Microsoft встроила свой браузер Edge во все игры сразу 8 ч.
Windows 11 получила мелкое, но очень полезное обновление индикатора батареи ноутбука 16 ч.
Германия поставила на боевое дежурство израильский подводный беспилотник Blue Whale для патрулирования Балтики 26 мин.
Марсоход Curiosity обнаружил, где на Красной планете плескались волны 51 мин.
Silicon Motion разрабатывает SSD-контроллер SM8466 с поддержкой PCIe 6.0 2 ч.
OpenAI, Softbank и Oracle запустили Stargate — предприятие на $500 млрд по превращению США в ИИ-сверхдержаву 3 ч.
Transcend выпустила SSD серии ETD410T формата U.2 для дата-центров 4 ч.
Владелец TikTok потратит в этом году $12 млрд на ИИ-ускорители от Nvidia и китайских производителей 4 ч.
Samsung вложит в контрактное производство чипов на порядок меньше, чем TSMC 6 ч.
Ускорители Ascend не готовы состязаться с чипами NVIDIA в деле обучения ИИ, но за эффективность инференса Huawei будет бороться всеми силами 6 ч.
Meta планирует выпустить умные очки Oakley, часы и наушники с ИИ 8 ч.
Nvidia в третий раз обошла Apple, став самой дорогой компанией в мире 8 ч.