Сегодня 03 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

«Т-Банк» представил ИИ-модель T-Pro 2.0 с гибридными рассуждениями, которая вдвое экономнее DeepSeek R1-Distil

Группа «Т-Технологии» представила свою первую большую языковую модель (LLM) с гибридным режимом рассуждений — T-Pro 2.0, входящую в семейство моделей Gen-T. Сообщается, что новая модель обеспечивает более высокое качество ответов на сложные запросы при двукратной экономии вычислительных ресурсов для русскоязычных задач по сравнению с аналогами Qwen3 и DeepSeek R1-Distil.

 Источник изображения: «Т-банк»

Источник изображения: «Т-банк»

Гибридные модели способны в зависимости от запроса выбирать между быстрыми, простыми ответами и глубоким анализом, что снижает затраты на вычисления при внедрении ИИ. По данным «Т-Технологий», расходы на разработку модели, включая затраты на вычислительные мощности для R&D и финального дообучения, а также зарплаты сотрудников, не превышают 120 млн рублей.

Такие модели лучше справляются со сложными аналитическими задачами, что позволяет использовать их в качестве основы для ИИ-агентов нового поколения, способных выполнять задачи без вмешательства человека. Например, в службе поддержки ИИ-агенты не просто помогают генерировать ответы, но и самостоятельно решают часть пользовательских запросов. В «Т-банке» доля таких обращений уже составляет 40 %.

Согласно данным «Т-Технологий», модель T-Pro 2.0 продемонстрировала более высокие результаты на русскоязычных бенчмарках — MERA, ruMMLU, Ru Arena Hard, ruAIME, ruLCB — по сравнению с другими открытыми моделями на 30 млрд параметров.

«Т-банк» планирует использовать новую модель для повышения качества работы своих ИИ-ассистентов, доступных всем клиентам банка, а также для повышения эффективности операционных процессов за счёт копайлот-решений и автономных агентов.

Сообщается, что благодаря переходу на внутреннюю версию T-Pro 2.0, обученную на собственных данных «Т-банка», повысилось качество работы автономных агентов поддержки: они стали на 10 % чаще решать задачи пользователей без участия оператора и дополнительных затрат на разработку или операционные процессы.

Модель T-Pro 2.0 с числом параметров 32 млрд находится в открытом доступе на платформе Hugging Face под лицензией Apache 2.0.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Nintendo выдала даты выхода трёх дополнений к кооперативному хоррору Reanimal от авторов Little Nightmares 56 мин.
Визуальная новелла в жанре психологического хоррора Slay the Princess достигла вершины продаж, о которой разработчики не могли и мечтать 2 ч.
Объём слитых в интернет данных россиян взлетел почти на 70 % в прошлом году 3 ч.
Онлайн-кинотеатры в России нарастили аудиторию до 75 млн зрителей и теперь думают над повышением цен 3 ч.
xAI выпустила Grok Imagine 1.0 с поддержкой создания 10-секундных видео в улучшенном разрешении 9 ч.
В Firefox появится выключатель всех ИИ-функций разом 14 ч.
Суровое альпинистское приключение Cairn от создателей Furi покорило вершину в 200 тысяч проданных копий всего за три дня 16 ч.
«Лучше большинства фильмов по RE»: трагичная короткометражка по мотивам Resident Evil Requiem впечатлила фанатов 18 ч.
За саундтрек можно не переживать: композитор «Ведьмака 3» напишет музыку для The Witcher 4 19 ч.
Firefly без ограничений: Adobe сняла лимиты на ИИ-генерацию изображений и видео, но не навсегда 19 ч.
В Китае создали компактный твердотельный лазер для ранее недоступного VUV-диапазона — выиграют наука, космос и чипмейкеры 39 мин.
Intel при поддержке SoftBank готова начать выпуск альтернативы памяти HBM к 2029 году 60 мин.
Китайский процессор Loongson 3B6000 оказался в среднем втрое медленнее AMD Ryzen 5 9600X 2 ч.
Switch стала самой популярной Nintendo в истории — продано более 155 млн консолей 2 ч.
Intel представила Xeon 600 для рабочих станций — до 86 ядер, разгон и цена до $7699 2 ч.
Индия объявила 20 лет налоговых каникул для гиперскейлеров, использующих местные ЦОД для обслуживания зарубежных облачных клиентов 2 ч.
Возвращение людей к Луне отложили до марта — ракета SLS для миссии Artemis II дала течь 3 ч.
CXMT и YMTC спешат нажиться на дефиците: Китай резко нарастит выпуск памяти 3 ч.
Giga Computing представила материнские платы для рабочих станций на базе Intel Xeon 600 3 ч.
86 P-ядер, 128 линий PCIe 5.0 и 8 каналов DDR5-6400/8800: Intel представила чипы Xeon 600 для рабочих станций 3 ч.