Сегодня 01 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → higgs

Российские учёные совершили прорыв в оптимизации ИИ-моделей — теперь их можно использовать без мощных серверов

Лаборатория исследований искусственного интеллекта Yandex Research совместно с учёными из НИУ ВШЭ, Массачусетского технологического института (MIT), Австрийского института науки и технологий (ISTA) и Научно-технологического университета им. короля Абдаллы (KAUST) создала метод сжатия больших языковых моделей (LLM) без потери качества. Теперь для работы с ИИ-моделями достаточно смартфона или ноутбука — не нужно задействовать дорогие серверы и графические ускорители.

 Luke Jones / Unsplash

Luke Jones / Unsplash

Новый метод квантизации получил название Hadamard Incoherence with Gaussian MSE-optimal GridS (HIGGS). Он позволяет сжимать нейросети без использования дополнительных данных и без вычислительно сложной оптимизации параметров. Такой подход особенно выгоден в ситуациях, когда недостаточно подходящих данных для дообучения ИИ-модели. Метод HIGGS обеспечивает баланс между качеством, размером модели и сложностью квантизации, за счёт чего ИИ-модели можно использовать на самых разных устройствах.

С помощью HIGGS можно существенно ускорить процесс тестирования и внедрения новых решений на базе ИИ, экономить время и финансы на разработку. Это сделает ИИ-модели доступнее не только для крупных, но и небольших компаний, а также некоммерческих лабораторий и институтов, индивидуальных разработчиков и исследователей. Если раньше для запуска ИИ-модели на смартфоне или ноутбуке требовалось провести её квантизацию на дорогостоящем сервере (этот процесс занимал от нескольких часов до нескольких недель), то теперь квантизацию можно выполнить прямо на смартфоне или ноутбуке за считанные минуты.

Новый метод квантизации протестировали на популярных ИИ-моделях Llama 3 и Qwen 2.5. В результате было установлено, что HIGGS является лучшим способом квантизации по соотношению качества к размеру модели среди всех существующих аналогов без использования данных, в том числе 4-bit NormalFloat и Half-Quadratic Quantization.

Метод HIGGS уже доступен разработчикам и исследователям на Hugging Face и GitHub, а посвящённая ему научная статья размещена в arXiv. Отметим также, что научную статью с описанием нового метода приняли на одну из крупнейших в мире ИИ-конференций The North American Chapter of the Association for Computation Linguistics (NAACL), которая пройдёт с 29 апреля по 4 мая в Альбукерке (штат Нью-Мексико, США). Статью уже цитировали американская компания Red Hat AI, Пекинский университет, Гонконгский университет науки и технологий и др.


window-new
Soft
Hard
Тренды 🔥
Стратегия Stormgate от экс-разработчиков StarCraft 2 скоро останется без мультиплеера, потому что провайдера серверов игры выкупила ИИ-компания 29 мин.
Anthropic вспомнила об авторских правах — она пытается смягчить последствия утечки кода Claude Code 45 мин.
Официально: апрельская подборка PS Plus включает пять игр вместо трёх, но есть нюанс 2 ч.
Амбициозный боевик Saros от разработчиков Returnal не опоздает к релизу — игра ушла на золото почти за месяц до выхода 3 ч.
Ollama получила поддержку аппаратного ускорения на чипах Apple M5 — при наличии 32 Гбайт памяти 4 ч.
Создатель Disco Elysium рассказал, при каком условии выйдет Disco Elysium 2 4 ч.
ЕС решил запретить ИИ-контент в официальных материалах 4 ч.
Эксперты призвали Google не показывать детям ИИ-контент на YouTube 4 ч.
Microsoft выпустила экстренное обновление для Windows 11, призванное исправить ошибки мартовского накопительного обновления 4 ч.
Heroes of Might & Magic: Olden Era появится в раннем доступе уже в апреле 4 ч.
У Huawei на порядок замедлился рост выручки по итогам 2025 года 11 мин.
Киберпанк для панка: мозговые импланты позволили парализованному мужчине писать музыку 26 мин.
SpaceX подала заявку на IPO, которое наверняка станет крупнейшим в мировой истории 37 мин.
AUO заявила о разработке первого в мире 24″ FHD-монитора с частотой обновления 800 Гц 41 мин.
Ажиотажный рост цен на оперативную память болезненно сказался на доступности Raspberry Pi 54 мин.
Intel выкупит оставшуюся долю в своей ирландской фабрике Fab 34 за $14,2 млрд 58 мин.
Спутник Starlink разрушился на орбите, но сохранился его «портрет», сделанный незадолго до столкновения 4 ч.
К 2030 году российский рынок электромобилей может достичь 100 000 шт./год 4 ч.
Японцы построили генератор запахов для VR-гарнитур 5 ч.
Дефицит памяти привёл к выпуску 3-Гбайт версии Raspberry Pi 4 и повышению цены Raspberry Pi 500+ сразу на $150 6 ч.