Сегодня 14 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Энтузиаст запустил ИИ-модель на древнем мини-ЭВМ PDP-11 с процессором на 6 МГц и 64 Кбайт ОЗУ

Ветеран из отдела разработки Microsoft Дэйв Пламмер (Dave Plummer), который в прошлом создал несколько важнейших компонентов Windows, продемонстрировал трансформерную модель ИИ, «работающую на оборудовании старше, чем большинство людей, спорящих в интернете об AGI». В опубликованном недавно видео опытный разработчик решил развеять миф об ИИ, раскрыв его «небольшой грязный секрет».

 Источник изображения: Дэйв Пламмер / YouTube

Источник изображения: Дэйв Пламмер / YouTube

Этот секрет в значительной степени раскрывается в начале описания к видео разработчика. «Дэйв использует PDP-11 для обучения настоящей нейронной сети, включающей трансформеры и механизм внимания, чтобы вы могли увидеть их в самом простейшем виде», — сказано в описании. Речь о системе PDP-11 возрастом 47 лет, которая оснащена процессором с рабочей частотой 6 МГц и 64 Кбайт оперативной памяти. На этом устройстве работает трансформерная ИИ-модель под названием Attention 11, написанная на ассемблере PDP-11 Дамьеном Буре (Damien Buret).

На первый взгляд задача, которую PDP-11 «научится» выполнять, кажется элементарной: устройство должно строить обратную последовательность из восьми чисел. Однако модель должна усвоить определённое структурное правило, а не запоминать примеры из обучения, чтобы успешно справляться с обработкой любых входящих данных. Пламмер отмечает, что в этом отражается базовый принцип, лежащий в основе современных языковых моделей, таких как ChatGPT.

Несмотря на использование специально созданной для PDP-11 трансформерной модели, Пламмеру потребовалось провести оптимизацию системы в виду ограничений в плане доступных вычислительных мощностей. Интересно то, что в конечном счёт получилась модель, имеющая всего 1216 параметров. Она используется вычисления с фиксированной точкой, вычисления для прямого прохода ужаты до 8-битной точности, а каждый такт оптимизирован, чтобы машина смогла завершить обучение в разумные сроки.

«Мы наблюдаем упрощённую анатомию самого обучения. Модель начинает глупой. Количество ошибок изначально высоко. Точность спотыкается на каждом шагу, как человек, пытающийся собрать мебель из IKEA в кузове движущегося фургона. А затем где-то на этом пути веса постепенно выстраиваются в определённый паттерн. И механизм внимания обнаруживает правило переворота последовательности. И машина в результате пересекает ту невидимую черту — от угадывания к знанию», — рассказал Пламмер.

Результаты эксперимента по обучению ИИ на древнем устройстве с процессором на 6 МГц оказались довольно неожиданными. Энтузиаст обучил модель до 100 % точности в задаче построения обратной последовательности из чисел примерно за 350 шагов обучения. На PDP-11/44 с платой кэш-памяти на это ушло около 3,5 минут.

По сути, Пламмер попытался доказать, что в современных ИИ-системах используется та же механика, т.е. большое количество арифметики, повторение шагов и исправление ошибок для улучшения результатов. «Эта старая машина не мыслит в каком-то мистическом смысле. Она просто выполняет арифметические действия, чтобы обновить несколько тысяч тщательно сохранённых чисел. И в этом вся суть. Обаяние современного ИИ в основном исходит от выполнения этого в ошеломляющем масштабе. Но сам фундаментальный процесс обучения уже полностью представлен здесь в миниатюре», — объяснил Пламмер.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Fatekeeper — наконец-то Dark Messiah 2? Предварительный обзор 15 ч.
Новая статья: Gamesblender № 780: RE Veronica, Stellar Blade 2, Gears of War: E-Day, Senua — главные анонсы июня 16 ч.
Вышло приложение ASCILINE Engine для трансляции «неблокируемого» ASCII-видео 23 ч.
ИИ-стартап Mistral AI ведёт переговоры о привлечении €3 млрд при оценке в €20 млрд 23 ч.
Авторитетное консалтинговое агентство KPMG опубликовало доклад об ИИ — и в нём нашли ИИ-галлюцинации 24 ч.
Google начала развёртывать поисковых ИИ-агентов — но пока лишь для платных пользователей 13-06 13:18
Водители Tesla научились обманывать автопилот игрушечной головой — чтобы листать соцсети за рулём 13-06 11:18
Генпрокуроры нескольких штатов США запустили проверку в отношении OpenAI 13-06 11:12
Anthropic отключила передовые ИИ-модели Mythos 5 и Fable 5 для всех пользователей по требованию США 13-06 08:19
Новая статья: Gothic Remake — в новом теле старый дух. Рецензия 13-06 00:03
Colt и Ciena успешно испытали «постквантовый» трансатлантический 800-Гбит/с канал 31 мин.
General Motors (GM) занялась разработкой натрий-ионных аккумуляторов для ЦОД 3 ч.
Великобритания потратит $1 млрд на ИИ-суперкомпьютер с британскими чипами 4 ч.
В Австралии запущен суперкомпьютер MAVERIC на базе NVIDIA GB200 NVL72 4 ч.
Индийский производитель деталей для iPhone оказался под угрозой закрытия из-за загрязнения окружающей среды 5 ч.
AMD утверждает, что ноутбук на базе Ryzen 5 220 лучше подходит для игр, чем Apple MacBook Neo 9 ч.
Удостоверяющий центр GlobalSign начал отзыв EV-сертификатов у российских компаний, находящихся под санкциями 14 ч.
Nvidia подняла рекомендованную цену RTX Pro 6000 Blackwell до $13 250 — рост на 55 % за год 21 ч.
We will VROC you: Graid Technology продолжит активное развитие купленной у Intel технологии RAID 21 ч.
Почти как в «Дюне»: в Техасе создали куртку для сбора воды из окружающего воздуха 23 ч.