Сегодня 15 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Alibaba нашла способ снизить затраты на обучение ИИ-моделей на 88 %

При обучении языковых моделей серьёзной проблемой является не только наличие адекватных аппаратных ресурсов и объёмов исходных данных, но и сумма затрат на обучение. Отказ от обращений к сторонним поисковым платформам, как отмечает Alibaba, позволяет снизить стоимость обучения на величину до 88 %.

 Источник изображения: Alibaba

Источник изображения: Alibaba

Соответствующий подход, как сообщает South China Morning Post, получил обозначение ZeroSearch. Задача генерации необходимых для обучения новых моделей данных в данном случае ложится на уже имеющиеся языковые модели. По сути, они имитируют обращение к сторонним поисковым сервисам, но метод подразумевает гораздо более низкие затраты. Например, обращение к Google через API с 64 000 запросов обойдётся разработчикам в $586,70, тогда как ИИ-модель с 14 млрд параметров способна то же количество запросов обработать при уровне затрат не более $70,80. Тем самым обеспечивается более чем 8-кратная экономия.

Подобный подход будет способствовать более выраженному прогрессу в разработке систем ИИ небольшими компаниями, которые не имеют доступа к серьёзной инфраструктуре и большим бюджетам. Сама Alibaba уже комбинирует возможности своих моделей семейства Qwen с поисковыми системами, обеспечивая более высокую точность ответов на сложные поисковые запросы.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Microsoft получит 30 тыс. ИИ-ускорителей NVIDIA Vera Rubin, от которых отказалась OpenAI, отменившая проект Stargate Norway 31 мин.
Lexar: геймеры готовы жертвовать объёмом оперативной памяти, но не SSD 2 ч.
Rolls-Royce анонсировала роскошный электрический кабриолет Project Nightingale — выпустят всего сто экземпляров 2 ч.
Broadcom поможет Meta в создании нескольких поколений ИИ-ускорителей 2 ч.
MSI представила обновлённые ноутбуки Raider, Crosshair, Titan и Cyborg с новыми чипами Intel и графикой RTX 50-й серии 2 ч.
Жители американского городка выгнали половину муниципального совета, втихую одобрившего строительство крупного ЦОД — на очереди мэр и другие чиновники 3 ч.
В США испытали базовую станцию сотовой связи на дирижабле — она трое суток работала из стратосферы 3 ч.
Дата-центры Oracle получит топливные элементы Bloom Energy на 2,8 ГВт 4 ч.
За последние десять дней акции Nvidia взлетели в цене на 18 % 4 ч.
Xiaomi представила бюджетные Redmi R70 и R70m с процессорами Unisoc T8300, 13-Мп камерами и ёмкими батареями 4 ч.