Сегодня 12 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Современную ИИ-модель запустили на крошечном компьютере Raspberry Pi Zero — непрактично, но работает

Энтузиаст Бинь Фам (Binh Pham) создал USB-устройство на основе одноплатного компьютера Raspberry Pi Zero, на котором локально запускается большая языковая модель искусственного интеллекта, генерирующая художественные тексты.

 Источник изображения: youtube.com/@build_with_binh

Источник изображения: youtube.com/@build_with_binh

Программную часть проекта автор разработал с помощью библиотеки llama.cpp и утилиты llamafile — они предназначены для вывода больших языковых моделей ИИ. Это оказалось непростой задачей, поскольку у Raspberry Pi Zero всего 512 Мбайт оперативной памяти и процессор с устаревшей архитектурой ARMv6, что помешало компиляции проекта в исходном варианте. Чтобы обойти эти ограничения, энтузиасту пришлось преобразовать оптимизированный для ARMv8 набор инструкций в llama.cpp и удалить оттуда все нотации и механизмы оптимизации, предназначенные для современного оборудования.

Сам одноплатный компьютер Raspberry Pi Zero и плату расширения с разъёмом USB для подключения к современным компьютерам Бинь Фам поместил в распечатанный на 3D-принтере корпус. Из-за скромных вычислительных ресурсов пришлось ограничить контекст 64 токенами и использовать модели, содержащие от 15 млн до 136 млн параметров. Самая маленькая — Tiny15M — показала максимальную скорость среди всех протестированных моделей: 223 мс на токен. Для Lamini-T5-Flan-77M этот показатель составил 2,5 с на токен, а для SmolLM2-136M — 2,2 с на токен.

При такой скорости работы устройство трудно назвать практичным, но автор проекта решил не останавливаться на достигнутом. Он посчитал, что управлять ИИ через интерфейс командной строки недостаточно удобно, и предложил более комфортный способ. Чтобы отправить запрос, пользователю необходимо создать в указанном расположении пустой текстовый файл, имя которого служит запросом к модели. Обнаружив файл, система отправляет запрос к ИИ и записывает его ответ в содержимое того же файла.

Своим проектом Бинь Фам решил показать, каким может стать взаимодействие с локальными моделями ИИ в будущем.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Персонализация поиска Google стала по-настоящему персональной — теперь можно самому выбирать источники 14 мин.
Capcom устроит «эксклюзивный показ» Resident Evil Requiem на Gamescom: Opening Night Live 36 мин.
Microsoft прекратит поддержку Windows 11 23H2 Home и Pro уже в ноябре 2 ч.
ИИ в работе и учёбе: почему непозволительно отключать голову 2 ч.
Веб-камеры Lenovo превратили в хакерские мультитулы — через них можно даже тайно взламывать ПК 2 ч.
«Победа для разработчиков и потребителей»: Fortnite вернётся на iOS в Австралии 3 ч.
League of Legends вскоре получит WASD-управление — игра станет дружелюбнее к новичкам 3 ч.
Nvidia выпустила драйвер, добавляющий поддержку DLSS 4 в GTA V Enhanced и Senua’s Saga: Hellblade II Enhanced 5 ч.
Sk Capital вложит в Softline 5 млрд рублей — это одна из крупнейших сделок на рынке 5 ч.
Геймплейный трейлер раскрыл дату выхода Henry Halfhead — поучительного приключения про половину головы с умением вселяться в предметы 6 ч.
Samsung выпустила первый телевизор с подсветкой Micro RGB и улучшенной цветопередачей 11 мин.
Учёные придумали невидимые для глаз световые водяные знаки для выявления дипфейков 2 ч.
Анонсирован смартфон Vivo V60 с оптикой Zeiss и ценой от $425 3 ч.
Мобильная графика Arm станет производительнее — в GPU встроят нейронные ускорители 3 ч.
Nvidia представила GeForce RTX 5090D V2: специальный флагман для Китая с урезанной памятью за те же деньги 4 ч.
Жаркая катка: видеокарта GeForce RTX 5090 вспыхнула во время игры в Battlefield 6 4 ч.
Supermicro представила 4U-сервер на базе NVIDIA HGX B200 с СЖО 4 ч.
Tesla запустила редкую рекламу своего автопилота, но пытается скрыть его несовершенство 4 ч.
Alibaba, ByteDance и другим китайским IT-гигантам придётся объясниться за закупки ИИ-ускорителей Nvidia H20 5 ч.
Китайские учёные отправили в Тибет робота-антилопу, который проследил за стадом настоящих 5 ч.