Сегодня 28 февраля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

«Торрент для запуска ИИ»: вышла утилита для распределённого запуска ИИ-моделей на любом оборудовании

Большие языковые модели искусственного интеллекта требуют значительных ресурсов не только при обучении, но и при запуске — необходимы существенные объёмы оперативной памяти и мощные графические процессоры. Альтернативу предложили создатели Exo — бесплатной программы для распределённого запуска ИИ на нескольких устройствах. Почти как торренты, только для запуска ИИ.

 Источник изображения: github.com/exo-explore/exo

Источник изображения: github.com/exo-explore/exo

Приложение позволяет объединять вычислительные ресурсы нескольких компьютеров, смартфонов и даже одноплатных компьютеров, в том числе Raspberry Pi, для запуска моделей, с которыми ни одна из имеющихся в распоряжении пользователя систем не справилась бы самостоятельно. Ресурсы устройств объединяются по одноранговой сети.

Exo динамически распределяет нагрузку, создаваемую большой языковой моделью, по доступным в сети устройствам, размещая её слои, исходя из доступного объёма оперативной памяти и имеющейся вычислительной мощности. Поддерживаются LLaMA, Mistral, LlaVA, Qwen и DeepSeek. Программа устанавливается на устройства под управлением Linux, macOS, Android или iOS — версии под Windows пока нет. Для работы Exo требуется минимальная версия Python 3.12.0 и, в случае машин под Linux с графикой Nvidia, ряд других компонентов.

Модель ИИ, требующую 16 Гбайт оперативной памяти, можно запустить на двух ноутбуках с 8 Гбайт на каждом; а мощную DeepSeek R1, которой нужны 1,3 Тбайт памяти, в теории можно запустить на кластере из 170 Raspberry Pi 5 с 8 Гбайт. Скорость сети и задержка могут снизить качество работы модели, и разработчики Exo предупреждают, что устройства небольшой производительности способны замедлить ИИ, но с каждым добавленным в сети устройством общая производительность увеличивается. Нельзя также забывать об угрозах безопасности, которые неизбежно возникают при совместном выполнении рабочих нагрузок на нескольких машинах. И даже с учётом этих оговорок Exo представляется перспективной альтернативой облачным ресурсам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Член Палаты лордов Великобритании потребовал от Fujitsu немедленно выплатить £300 млн пострадавшим от сбоев в её ПО 2 ч.
Electronic Arts сделала подарок моддерам и выложила в открытый доступ исходный код классических Command & Conquer 2 ч.
Monster Hunter Wilds ворвалась в топ-10 самых популярных игр за всю историю Steam, опередив Baldur's Gate 3, Hogwarts Legacy и Elden Ring 4 ч.
Meta уволила около 20 сотрудников за разглашение конфиденциальной информации 5 ч.
Чат-бот Meta AI скоро получит отдельное приложение для конкуренции с ChatGPT 5 ч.
Microsoft накрыла банду хакеров, которая обманом заставляла ИИ рисовать неподобающие фейки со знаменитостями 6 ч.
Фанатам показалось, что в последнем ролике The Witcher 4 засветилась новая модель Цири — CD Projekt Red отреагировала 6 ч.
WhatsApp оштрафовали в России на 17 млн рублей 7 ч.
Не понимали, на что подписывались: чиновники Бирмингема не имели представления о специфике ERP Oracle Fusion до её провального внедрения 8 ч.
Российский рынок корпоративного ПО в 2024 году без малого достиг уровня 2021 года 15 ч.
В США испытали геомеханический аккумулятор — он запасает энергию в сжатии земных пород 2 мин.
Российский производитель модульных ЦОД ДАТАРК выходит на рынок Беларуси при поддержке Noventiq 2 ч.
Российский рынок геймерских видеокарт за три года вырос на 70 % — лидером осталась Nvidia 2 ч.
SpaceX признала, что обломки спутников Starlink могут упасть кому-то на голову — но больно не будет 3 ч.
В России начались продажи флагманского планшета Huawei MatePad Pro 13.2 по цене от 100 тыс. рублей 3 ч.
Broadcom представила новые решения PCIe 6.0 — чип-коммутатор и ретаймеры 4 ч.
QNAP представила доступный коммутатор QSW-2104-2T-R2 с поддержкой 10GbE и 2.5GbE 4 ч.
IBM представила СХД FlashSystem C200 формата 2RU с эффективной ёмкостью 2,3 Пбайт 4 ч.
В Сингапура арестовали подозреваемых в контрабанде санкционных ИИ-чипов Nvidia в Китай — им грозит 20 лет тюрьмы 4 ч.
Tecno предварительно представила сверхтонкий смартфон Spark Slim и элегантные умные очки с ИИ и AR 4 ч.