Сегодня 17 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Hardware

Энтузиаст запустил ИИ-модель на древнем мини-ЭВМ PDP-11 с процессором на 6 МГц и 64 Кбайт ОЗУ

Ветеран из отдела разработки Microsoft Дэйв Пламмер (Dave Plummer), который в прошлом создал несколько важнейших компонентов Windows, продемонстрировал трансформерную модель ИИ, «работающую на оборудовании старше, чем большинство людей, спорящих в интернете об AGI». В опубликованном недавно видео опытный разработчик решил развеять миф об ИИ, раскрыв его «небольшой грязный секрет».

 Источник изображения: Дэйв Пламмер / YouTube

Источник изображения: Дэйв Пламмер / YouTube

Этот секрет в значительной степени раскрывается в начале описания к видео разработчика. «Дэйв использует PDP-11 для обучения настоящей нейронной сети, включающей трансформеры и механизм внимания, чтобы вы могли увидеть их в самом простейшем виде», — сказано в описании. Речь о системе PDP-11 возрастом 47 лет, которая оснащена процессором с рабочей частотой 6 МГц и 64 Кбайт оперативной памяти. На этом устройстве работает трансформерная ИИ-модель под названием Attention 11, написанная на ассемблере PDP-11 Дамьеном Буре (Damien Buret).

На первый взгляд задача, которую PDP-11 «научится» выполнять, кажется элементарной: устройство должно строить обратную последовательность из восьми чисел. Однако модель должна усвоить определённое структурное правило, а не запоминать примеры из обучения, чтобы успешно справляться с обработкой любых входящих данных. Пламмер отмечает, что в этом отражается базовый принцип, лежащий в основе современных языковых моделей, таких как ChatGPT.

Несмотря на использование специально созданной для PDP-11 трансформерной модели, Пламмеру потребовалось провести оптимизацию системы в виду ограничений в плане доступных вычислительных мощностей. Интересно то, что в конечном счёт получилась модель, имеющая всего 1216 параметров. Она используется вычисления с фиксированной точкой, вычисления для прямого прохода ужаты до 8-битной точности, а каждый такт оптимизирован, чтобы машина смогла завершить обучение в разумные сроки.

«Мы наблюдаем упрощённую анатомию самого обучения. Модель начинает глупой. Количество ошибок изначально высоко. Точность спотыкается на каждом шагу, как человек, пытающийся собрать мебель из IKEA в кузове движущегося фургона. А затем где-то на этом пути веса постепенно выстраиваются в определённый паттерн. И механизм внимания обнаруживает правило переворота последовательности. И машина в результате пересекает ту невидимую черту — от угадывания к знанию», — рассказал Пламмер.

Результаты эксперимента по обучению ИИ на древнем устройстве с процессором на 6 МГц оказались довольно неожиданными. Энтузиаст обучил модель до 100 % точности в задаче построения обратной последовательности из чисел примерно за 350 шагов обучения. На PDP-11/44 с платой кэш-памяти на это ушло около 3,5 минут.

По сути, Пламмер попытался доказать, что в современных ИИ-системах используется та же механика, т.е. большое количество арифметики, повторение шагов и исправление ошибок для улучшения результатов. «Эта старая машина не мыслит в каком-то мистическом смысле. Она просто выполняет арифметические действия, чтобы обновить несколько тысяч тщательно сохранённых чисел. И в этом вся суть. Обаяние современного ИИ в основном исходит от выполнения этого в ошеломляющем масштабе. Но сам фундаментальный процесс обучения уже полностью представлен здесь в миниатюре», — объяснил Пламмер.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Возраст не помеха: спустя семь лет с релиза Devil May Cry 5 установила рекорд по продажам за год 14 мин.
Дженсен Хуанг: обществу необходимы «новые социальные нормы» в эпоху ИИ 2 ч.
Смартфоны Samsung научатся оценивать здоровье питомцев по фотографии 2 ч.
Спустя четыре года апгрейд GTA V до версий для PS5, Xbox Series X и S всё-таки станет бесплатным 2 ч.
Создатели хоррор-шутера Luna Abyss остались без работы через месяц после релиза — всех уволили 3 ч.
Внезапная блокировка Anthropic Fable 5 подстегнула интерес к открытым ИИ-моделям 3 ч.
Голосовые сообщения в WhatsApp можно будет отправлять не открывая приложение — прямо из виджета 4 ч.
Telegram через суд обжаловал блокировку в Индии 5 ч.
Windows 11 избавится от лишних перезагрузок: обновления будут устанавливаться за один цикл 7 ч.
«Минимальные усилия, но максимальный эффект»: Digital Foundry показала, как Sony может прокачать Bloodborne на PS5 без FromSoftware 7 ч.
MSI наделила свои платы для Intel поддержкой половинчатых модулей DDR5 HUDIMM 28 мин.
Учёные разработали память, которая умеет забывать лишнюю информацию — совсем как человеческий мозг 2 ч.
Nvidia показала роботов, которые сами научились собирать ПК — но почему-то дорогие видеокарты им не доверила 3 ч.
Китай проследит, как ИИ отнимает и создаёт рабочие места 3 ч.
Silicon Motion будет внедрять PCIe 6.0 в SSD с оглядкой на процессоры Nvidia, а не Intel или AMD 3 ч.
Тяжёлая ракета Ariane 6 впервые стартовала в самой мощной конфигурации — она вывела на орбиту спутники Amazon Leo 3 ч.
«Мегафон» связал Россию и Китай новым магистральным каналом связи 4 ч.
«Я собираюсь красть ваших клиентов»: глава Nothing объявил войну Apple из-за слишком скучных iPhone 4 ч.
IDC: на x86 теперь приходится лишь чуть более половины рынка серверов, в основном из-за ИИ 5 ч.
Представлен человекоподобный робот Genesis Eno, непохожий на человека 5 ч.