Сегодня 14 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Современную ИИ-модель запустили на крошечном компьютере Raspberry Pi Zero — непрактично, но работает

Энтузиаст Бинь Фам (Binh Pham) создал USB-устройство на основе одноплатного компьютера Raspberry Pi Zero, на котором локально запускается большая языковая модель искусственного интеллекта, генерирующая художественные тексты.

 Источник изображения: youtube.com/@build_with_binh

Источник изображения: youtube.com/@build_with_binh

Программную часть проекта автор разработал с помощью библиотеки llama.cpp и утилиты llamafile — они предназначены для вывода больших языковых моделей ИИ. Это оказалось непростой задачей, поскольку у Raspberry Pi Zero всего 512 Мбайт оперативной памяти и процессор с устаревшей архитектурой ARMv6, что помешало компиляции проекта в исходном варианте. Чтобы обойти эти ограничения, энтузиасту пришлось преобразовать оптимизированный для ARMv8 набор инструкций в llama.cpp и удалить оттуда все нотации и механизмы оптимизации, предназначенные для современного оборудования.

Сам одноплатный компьютер Raspberry Pi Zero и плату расширения с разъёмом USB для подключения к современным компьютерам Бинь Фам поместил в распечатанный на 3D-принтере корпус. Из-за скромных вычислительных ресурсов пришлось ограничить контекст 64 токенами и использовать модели, содержащие от 15 млн до 136 млн параметров. Самая маленькая — Tiny15M — показала максимальную скорость среди всех протестированных моделей: 223 мс на токен. Для Lamini-T5-Flan-77M этот показатель составил 2,5 с на токен, а для SmolLM2-136M — 2,2 с на токен.

При такой скорости работы устройство трудно назвать практичным, но автор проекта решил не останавливаться на достигнутом. Он посчитал, что управлять ИИ через интерфейс командной строки недостаточно удобно, и предложил более комфортный способ. Чтобы отправить запрос, пользователю необходимо создать в указанном расположении пустой текстовый файл, имя которого служит запросом к модели. Обнаружив файл, система отправляет запрос к ИИ и записывает его ответ в содержимое того же файла.

Своим проектом Бинь Фам решил показать, каким может стать взаимодействие с локальными моделями ИИ в будущем.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В популярнейшем архиваторе 7-Zip обнаружены две уязвимости, позволяющие удалённо взламывать ПК 6 ч.
Microsoft затруднит доступ к режиму Internet Explorer в Edge из-за атак хакеров — уязвимости останутся без патчей 7 ч.
Painkiller, «Герои Меча и Магии», новый «Мор» и многое другое: в Steam стартовал фестиваль «Играм быть» с тысячами демоверсий 7 ч.
В поиске Google теперь можно скрывать рекламу — но посмотреть её всё равно придётся 8 ч.
Apple TV+ превратился в просто Apple TV — стриминговый сервис ждёт «яркая новая идентичность» 8 ч.
Новый геймплейный трейлер раскрыл дату релиза Pathologic 3 — в 2025 году игра всё-таки не выйдет 9 ч.
«Просто огонь… вода, земля, воздух»: фанатов впечатлил первый геймплей файтинга Avatar Legends: The Fighting Game по «Аватару: Легенда об Аанге» 10 ч.
Календарь релизов — 13–19 октября: Steam Next Fest, Keeper, Ball x Pit и Pokémon Legends: Z-A 12 ч.
Отправиться в жуткое кооперативное приключение Reanimal от создателей Little Nightmares можно уже сейчас — в Steam вышла демоверсия 12 ч.
Лавкрафтианский хоррор-шутер Beneath не заставит себя долго ждать — новый трейлер, дата выхода и демоверсия в Steam 12 ч.
Квартальная прибыль Samsung выросла почти на треть до максимального за три года уровня 32 мин.
Колл-центры перешли на мобильные номера, чтобы избежать платной маркировки при звонках россиянам 59 мин.
Ошибка в Google Play Services вызвала хаос в новых Pixel 10 — приложения «падают» 2 ч.
OCP запустила инициативу Open Data Center for AI для стандартизации инфраструктуры передовых ИИ ЦОД с мегаваттными стойками 4 ч.
Новая статья: Обзор смартфона Google Pixel 10 Pro XL: магнитная аномалия 6 ч.
Vivo представила смарт-часы Watch GT 2 с автономностью до 33 дней, большим экраном и eSIM 6 ч.
Неубиваемый смартфон Honor X9d с батареей на 8300 мА·ч поступил в продажу в России — от 33 990 рублей 8 ч.
Энтузиасты починили продырявленную GeForce RTX 5070 Ti с помощью AMD Radeon RX 580 10 ч.
Складной iPhone Fold будет дешевле, чем ожидалось — Apple нашла способ сэкономить 10 ч.
OpenAI превратится в чипмейкера — Broadcom поможет проложить «путь к будущему ИИ» на 10 ГВт 10 ч.