Российские банки попробовали китайские ИИ-ускорители — дешевле Nvidia, но перегреваются и нестабильны
Читать в полной версииАмериканские правила экспортного контроля не разрешают поставлять в Россию современные ускорители вычислений для инфраструктуры систем искусственного интеллекта. Крупные российские банки в таких условиях пытаются понять, насколько китайские ускорители вычислений смогут стать альтернативной привычным решениям Nvidia и других западных поставщиков.
Источник изображения: Huawei Technologies
Впрочем, по общему мнению банкиров, говорить о возможности полностью заменить ускорители Nvidia речи пока нет. Китайские компании действительно предлагают более дешевые микросхемы, но пока они перегреваются и уступают в стабильности.
По данным «Ведомостей», «Сбер» и «Т-банк» начали тестировать китайские ускорители в своих системах искусственного интеллекта, «Альфа-банк» такую возможность пока только рассматривает. Прежде всего, этим организациям требуется альтернатива покинувшей российский рынок продукции Nvidia. Первый заместитель председателя правления Сбербанка Александр Ведяхин на прошедшем в этом месяце ВЭФ заявил, что все центры обработки данных этого банка работают на ускорителях Nvidia. По этой причине в условиях санкций остро стоит вопрос их замены на компоненты из дружественных стран. «Как только в Китае появятся соответствующие чипы, мы с удовольствием попробуем, чтобы понять, как наша модель будет работать на китайском оборудовании», — пояснил представитель банка.
Источник «Ведомостей» в одном из российских производителей электроники признался, что «Сбер» уже приступил к тестированию различных китайских чипов для ИИ, опередив многих своих конкурентов на российском рынке. Некоторые из разработчиков, сотрудничающих с банком, также слышали о планах «Сбера» перейти на китайские компоненты в этой сфере. Аналогичные испытания проводит и «Т-банк», как отмечают источники. Официальные представители обеих организаций данные слухи не прокомментировали.
Директор по ИИ в IT «Альфа-банка» Святослав Соловьёв в интервью «Ведомостям» подчеркнул, что данная организация пока не использует китайские чипы для ИИ, но ведёт переговоры на соответствующие темы с производителями и провайдерами облачных услуг. В качестве платформы для тестирования банк рассматривает ускорители MetaX C500. Применять их в «Альфа-банке» собираются только при соответствии их фактических параметров быстродействия предъявляемым требованиям к развитию систем генеративного ИИ.
Представитель ВТБ сообщил, что банк придерживается стратегии технологического суверенитета, но вдаваться в конкретику не стал. «Мы очень оптимистично смотрим на независимые от Nvidia GPU-технологии. Они способны обеспечить существенно большую прозрачность технологического стека и имеют потенциал снижения общей стоимости владения ИИ-технологиями», — сказал представитель ВТБ.
По словам заместителя исполнительного директора ЦК НТИ по большим данным Гарника Арутюняна, китайские ускорители вполне способны заменить западные в банковской инфраструктуре РФ в ряде базовых сценариев: скоринге клиентов в реальном времени, антифрод-системах, персонализации сервисов, работе с голосовыми и текстовыми ассистентами. При этом в ряде ресурсоёмких задач типа дообучения больших языковых моделей решения Nvidia всё равно останутся эталонами с точки зрения производительности. Потребности «Сбера» в этой сфере оцениваются в тысячах чипов в год, «Т-банк» и «Альфа-банк» в этом смысле могут ограничиваться сотнями чипов или одной тысячей чипов в год.
Проблема, по мнению исполнительного директора ИИ-платформы AutoFAQ Владислава Беляева, как раз заключается в том, что китайские ускорители плохо проявляют себя в обучении больших языковых моделей, а банки как раз вынуждены развивать собственную инфраструктуру в этой сфере, чтобы обеспечить защиту своих конфиденциальных финансовых данных. Полноценной заменой американским ускорителям китайские в такой ситуации стать не могут. Китайские ускорители также не отличаются универсальностью работы с программным кодом, поэтому адаптация к ним существующих систем ИИ также представляет определённую сложность. Именно по этой причине российские банки сперва хотят понять по итогам тестирования, в какой сфере удастся перейти на китайские ускорители с минимальными затратами и потерями.