Сегодня 15 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

«Т-Банк» открыл доступ к русскоязычной ИИ-модели с 32 млрд параметров

«Т-банк» открыл доступ к двум большим языковым моделям (LLM): T-Pro с 32 млрд параметров и обновленной T-Lite с 7 млрд параметров, созданным на базе моделей семейства Qwen-2.5 китайской Alibaba Group, и дообученным с адаптацией к русскому языку, пишут «Ведомости» со ссылкой на представителя компании. Ранее, в июле «Т-банк» открыл доступ к первой версии T-Lite.

 Источник изображения: «Т-банк»

Источник изображения: «Т-банк»

T-Pro и T-Lite относятся к семейству собственных языковых моделей «Т-Банка» Gen-T, которые, в отличие от универсальных моделей, таких как ChatGPT, предназначены для решения узкоспециализированных задач в конкретных областях. С их помощью компании смогут создавать умные чат-боты для поддержки клиентов или ассистентов для своих сотрудников, которые помогут в написании кода, составлении отчетов, подготовке исследований и т.д. Это позволит компаниям сэкономить на создании собственных больших языковых моделей.

По словам представителя «Т-банка», использование моделей Qwen-2.5 позволяет компании на 80–90 % сократить затраты на создание больших языковых моделей по сравнению с тем, если бы их обучали с нуля. Вместе с тем качество LLM-продуктов на русском языке превосходит решения, базирующиеся на открытых и проприетарных моделях от OpenAI, Google и Anthropic.

Такой подход используют и другие компании. Например, в ноябре МТС представила ИИ-модель Cotype Nano с 1,5 млрд параметров, тоже созданную на базе Qwen 2.5 Alibaba Cloud.

В свою очередь, в «Яндексе» ранее сообщили, что размышляют над возможностью выложить исходный код своей модели в открытый доступ. А «Сбер» предоставляет открытый доступ к моделям Kandinsky для генерации изображений и GigaAM для обработки речи.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Monster Train 2 — этот поезд не остановить. Рецензия 2 ч.
Новая статья: Gamesblender № 730: анонсы презентации Xbox и наследник Mass Effect от Owlcat (вместо Е3: часть 2) 3 ч.
YouTube тестирует новый формат длинной рекламы, которую нельзя пропустить 5 ч.
Google разорвёт отношения со Scale AI после её сближения с Meta 7 ч.
ChatGPT научился искать в интернете по картинкам и давать более точные ответы 7 ч.
Scale AI получила от Meta более $14 млрд, но потеряла гендиректора и рискует лишиться крупных контрактов с Gooogle, Microsoft, OpenAI и xAI 9 ч.
ChatGPT попросил сообщить журналистам, что он пытается «ломать» людей 10 ч.
Apple не намерена переводить iPad на macOS, несмотря на движение iPadOS к macOS 10 ч.
Используя методы из психиатрии, учёные обнаружили сходство мышления человека и искусственного интеллекта 12 ч.
Sony сдалась и вернула в продажу почти все свои игры в Steam для стран без поддержки PSN 14 ч.
Администрация Трампа решила разобраться в госконтрактах со SpaceX, чтобы узнать, как лишить Маска финансирования 5 ч.
AMD представила Pensando Pollara 400 — первую 400-Гбит/с сетевую карту стандарта Ultra Ethernet 6 ч.
Asus ROG Astral GeForce RTX 5090 Dhahab Edition с автографом Дженсена Хуанга продали на аукционе за $24 200 6 ч.
Китайские учёные изготовили уникальный радиотелескоп для исследования тёмной энергии 7 ч.
Тайвань отправил в тюрьму капитана китайского судна, обвинив его в умышленном повреждении подводного кабеля 7 ч.
Intel выпустит недорогой шестиядерник Core 5 120F для платформы LGA 1700 7 ч.
Apple внесла iPhone XS в список винтажных гаджетов 9 ч.
AWS переведёт ещё 100 дата-центров на использование очищенных сточных вод для охлаждения 10 ч.
В Калифорнийском университете попробовали охлаждать процессоры мокрой тряпкой и добились теплоотвода 800 Вт 11 ч.
Sony не увидела угрозы в Nintendo Switch 2 — для «ярких впечатлений на большом экране» нужна быстрая PS5 11 ч.