Сегодня 18 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → глубокое обучение

Глава Nvidia рассказал, как изобретение технологии глубокого обучения началось в 2012 году с архитектуры Fermi и пары GeForce GTX 580

Технология глубокого обучения (от англ. «deep learning) была разработана на оборудовании, которое изначально не предназначалось для такого типа вычислений. Генеральный директор Nvidia Дженсен Хуанг (Jensen Huang) рассказал в подкасте Джо Рогана (Joe Rogan), что исследователи, впервые разработавшие глубокое обучение, сделали это на паре 3-гигабайтных видеокарт GeForce GTX 580 в режиме SLI ещё в 2012 году.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Исследователи из Университета Торонто изобрели глубокое обучение для улучшения распознавания изображений в системах компьютерного зрения. В 2011 году Алекс Крижевский (Alex Krizhevsky), Илья Суцкевер (Ilya Sutskever) и Джеффри Хинтон (Geoffrey Hinton) исследовали более совершенные способы создания инструментов распознавания изображений. В то время нейронных сетей ещё не существовало. Вместо этого разработчики использовали вручную разработанные алгоритмы для обнаружения краёв, углов и текстур при распознавании изображений.

Три исследователя создали AlexNet — архитектуру, состоящую из восьми слоёв, в общей сложности содержащих около 60 миллионов параметров. Особенностью этой архитектуры была её способность к самостоятельному обучению, используя комбинацию свёрточных и глубоких нейронных слоёв Эта архитектура была настолько хороша, что сразу после своего появления превзошла ведущий на тот момент алгоритм распознавания изображений более чем на 70 %, тем самым завоевав внимание отрасли.

Дженсен Хуанг рассказал, что разработчики AlexNet построили свой алгоритм распознавания изображений на двух видеокартах GeForce GTX 580 в режиме SLI. Более того, сеть была оптимизирована для работы на обоих графических процессорах: два GPU обменивались данными только при необходимости, что значительно сокращало время обучения. Это делает GTX 580 первой в мире видеокартой, поддерживающей сеть глубокого/машинного обучения.

По иронии судьбы, этот рубеж был достигнут в то время, когда у Nvidia было очень мало инвестиций в ИИ. Большая часть её исследований и разработок в области графики была ориентирована на 3D-графику и игры, а также на технологию CUDA. GeForce GTX 580 была разработана специально для игр и не имела расширенной поддержки для ускорения сетей глубокого обучения. Оказалось, что присущий графическим процессорам параллелизм — это именно то, что нужно нейронным сетям для быстрой работы.

Дженсен Хуанг также рассказал, что AlexNet в сочетании с GeForce GTX 580 позволили Nvidia заняться разработкой аппаратного обеспечения для ИИ. Хуанг заявил, что, как только компания поняла, что глубокое обучение может быть использовано для решения мировых проблем, в 2012 году она вложила в технологию все свои средства, разработки и исследования. Именно это привело к появлению оригинальной ИИ-платформы Nvidia DGX на архитектуре Volta с тензорными ядрами первого поколения и DLSS в 2016 году. Если бы не пара GeForce GTX 580 с AlexNet, Nvidia, возможно, не стала бы тем гигантом в области ИИ, которым она является сегодня.


window-new
Soft
Hard
Тренды 🔥
SEC и Илон Маск ищут досудебное решение по делу о покупке Twitter 12 мин.
Valve раскрыла часть игр, которые получат скидку на весенней распродаже Steam: опубликован официальный трейлер акции 33 мин.
DuckDuckGo добавила в Duck.ai рассуждающие ИИ-модели GPT-5.2 и GPT-5 mini 4 ч.
Fortnite вернётся в Play Store по всему миру вместе с запуском сезона «Противостояние» 13 ч.
Хардкорная сложность, вырезанный контент и новые кошмары: с выходом ПК-версии Death Stranding 2: On the Beach получит крупное обновление 13 ч.
Скандал с почтовым ПО Horizon не утихает: тысячи невинно осуждённых британцев до сих пор без выплат 15 ч.
Bethesda разразилась новостями о Starfield — сюжетное дополнение Terran Armada, крупное обновление Free Lanes и версия для PS5 15 ч.
Alibaba запустила платформу для ИИ-агентов Wukong с интеграцией Slack и Teams 16 ч.
Чат-бот Anthropic Claude научился генерировать шрифты на основе рукописного текста 16 ч.
Disco Elysium, Resident Evil 7, Like a Dragon: Infinite Wealth и многие другие: Microsoft раскрыла последние новинки Game Pass в марте 17 ч.
NVIDIA выпустила однослотовый ускоритель RTX Pro 4500 Blackwell Server Edition с 32 Гбайт памяти GDDR7 2 ч.
Samsung намеревается наладить массовый выпуск чипов Tesla в Техасе во второй половине следующего года 2 ч.
Nvidia возобновила выпуск ускорителей H200, поскольку власти Китая дали добро на их импорт 3 ч.
Nvidia готовит для китайского рынка особую версию ИИ-чипов Groq 3 ч.
На рынке центральных процессоров тоже назревает глобальный дефицит, грозящий ростом цен 6 ч.
Доступные смартфоны Samsung перейдут на OLED-панели китайской CSOT — Samsung Display очень недовольна 9 ч.
Новая статья: Обзор смартфона Google Pixel 10a: Google, где изменения? 10 ч.
Nvidia наконец выпустила рабочую станцию DGX Station на базе GB300 Grace Blackwell — у неё почти полтерабайта LPDDR5X 11 ч.
Oppo представила флагманский складной смартфон Find N6 с «практически невидимой складкой» по цене от $1437 12 ч.
В России утверждён план развития высокопроизводительных вычислений и суперкомпьютерной инфраструктуры 12 ч.