|
Опрос
|
реклама
Быстрый переход
Nvidia: встроенных NPU хватит лишь на базовые ИИ-задачи — для AI PC нужны видеокарты GeForce
02.05.2024 [16:36],
Анжелла Марина
Компания Nvidia заявила, что её потребительские графические ускорители GeForce RTX показывают куда более высокую производительность в задачах ИИ по сравнению со специализированными нейропроцессорами в новейших центральных. Последние, по мнению Nvidia, годятся разве что для базовых ИИ-задач.
Источник изображения: Nvidia Компания Nvidia не так давно провела презентацию, в рамках которой показала способности своих потребительских видеокарт GeForce RTX в задачах искусственного интеллекта. По мнению Nvidia, её графические процессоры способны обеспечить более высокую производительность в приложениях ИИ по сравнению с выделенными нейропроцессорами (NPU), которыми оснащаются многие современные мобильные процессоры Intel, AMD, Apple и Qualcomm. Данные встроенные ИИ-ускорители предлагают производительность 10–45 TOPS (триллионов операций в секунду). По словам Nvidia, её видеокарты способны обеспечить от 100 до 1300 TOPS в зависимости от модели. В подтверждение этого тезиса были приведены результаты тестов, в которых видеокарты GeForce RTX сравнивались с чипом Apple M3 Max, установленным на новейших MacBook Pro и обладающим NPU с производительностью 18 TOPS. В тестах оценивалась производительность в популярных приложениях для обработки изображений и видео с использованием возможностей ИИ, таких как Stable Diffusion, Arnold, Blender и других. Тест показал, что ноутбук с мобильной видеокартой GeForce RTX 4090 превосходит MacBook Pro с M3 Max более чем в 5 раз. Более того, даже мобильная видеокарта среднего уровня RTX 4050 превосходит тот же MacBook Pro более чем в 2 раза, по данным Nvidia. В среднем мобильная RTX 4090 превосходила M3 Max в 5 раз, а мобильная RTX 4050 — на 50–100 %. В другом показательном тесте замерялась скорость работы с большими языковыми моделями (LLM). Здесь GeForce RTX 4090 также значительно опередила чип Apple даже при увеличении размера обрабатываемых пакетов данных. GeForce RTX 4090 оказался быстрее на 42 %, чем M3 Max. По мнению Nvidia, результаты тестирования наглядно демонстрируют, что производительность графических процессоров в задачах ИИ может в разы превосходить специализированные нейропроцессоры (NPU). Компания даже предложила разделить аппаратные средства для ИИ на три категории — базовый ИИ, премиальный ИИ и тяжелый ИИ. Последняя категория относится к мощным серверным решениям на базе GPU, способным обеспечить тысячи TOPS. Потребительские видеокарты, по мнению Nvidia, способны справиться с премиальным ИИ, а вот встроенных NPU хватит лишь для базового ИИ. Однако по мнению специалистов, пока рано говорить о том, что графические процессоры полностью вытеснят NPU в компьютерах, ориентированных на работу с ИИ. К примеру, Microsoft в своем определении к ПК с искусственным интеллектом (AI PC) требует наличия как GPU, так и NPU. Кроме того, не стоит забывать про энергоэффективность, так как мощные графические процессоры потребляют гораздо больше энергии по сравнению с оптимизированными нейропроцессорами. В целом, по мере развития инструментов на основе ИИ и усложнения решаемых ими задач, вычислительных мощностей специализированных NPU может оказаться недостаточно. А значит, роль мощных графических процессоров будет только возрастать. В конце отметим, что н е упустила Nvidia возможности сравнить свои видеокарты и с решениями конкурента. В тесте генерации изображений при помощи искусственного интеллекта настольная GeForce RTX 4090 показала преимущество почти в 3 раза над флагманским графическим ускорителем AMD Radeon RX 7900 XTX . При этом все модели линейки GeForce RTX начиная с RTX 4070 Super превзошли по производительности самую мощную видеокарту AMD. Заявления руководства Alphabet, Microsoft и Meta✴ подняли капитализацию Nvidia на 15 %
27.04.2024 [12:38],
Алексей Разин
Уходящая неделя характеризовалась высокой концентрацией квартальных отчётов крупных компаний технологического сектора, поэтому комментарии их руководства относительно перспектив дальнейшего развития систем искусственного интеллекта могли оказать влияние на настроения инвесторов. Если на предыдущей неделе капитализация Nvidia снижалась, то на этой она выросла на 15 % или $290 млрд.
Источник изображения: Nvidia Как поясняет Bloomberg, для данного Nvidia уходящая неделя оказалась лучшей с прошлого мая. По словам аналитиков, заявления представителей Meta✴✴ Platforms, Alphabet и Microsoft о намерениях вложить десятки миллиардов долларов в развитие инфраструктуры искусственного интеллекта непосредственно повлияли на котировки акций Nvidia, которая остаётся крупнейшим поставщиком ускорителей вычислений, которые формируют инфраструктуру подобных систем. Эксперты Bank of America отметили, что ключевые игроки американского облачного рынка — Google, Microsoft и Meta✴✴ в текущем календарном году должны существенно увеличить капитальные затраты, и немалая их часть будет направлена как раз на закупку ускорителей Nvidia. В прошлую пятницу акции Nvidia упали в цене сразу на 10 %, и это стало сильнейшим дневным снижением более чем за четыре года. Толчком к движению акций вниз послужили заявления руководства TSMC о сохранении консервативного прогноза относительно роста рынка полупроводниковых компонентов. Тайваньская компания TSMC в данный момент занимается выпуском всех ускорителей вычислений Nvidia. Фондовые индексы США на этой неделе росли: «полупроводниковый» SOX прибавил сразу 10 %, S&P 500 вырос на 2,7 %, а Nasdaq 100 вырос на 4 %. Примечательно, что возросшие затраты Meta✴✴ на инфраструктуру пока не сопровождаются ростом выручки, поэтому и акции компании на уходящей неделе упали в цене на 11 %. Руководству Google и Microsoft удалось убедить инвесторов, что вложения в ИИ уже обеспечивают финансовую отдачу. Ещё один крупный игрок облачного рынка — Amazon, отчитается о результатах квартала в ближайший вторник. Nvidia анонсировала выступление Дженсена Хуанга за день до начала Computex 2024
25.04.2024 [18:16],
Владимир Фетисов
График ключевых выступлений на ежегодной выставке Computex 2024 очень плотный. Уже объявлено о нескольких важных докладах, в том числе от AMD, Intel и Qualcomm, которые, как ожидаются, будут посвящены важным новинкам. Теперь же стало известно, что Nvidia тоже намерена выступить с докладом, но сделает это ещё до старта Computex.
Источник изображения: videocardz.com Генеральный директор Nvidia Дженсен Хуанг (Jensen Huang) 2 июня выступит с докладом в спортивном центре Национального Тайваньского университета. Выступление начнётся в 19:00 по местному времени. Ожидается, что в ходе его выступления речь пойдёт об искусственном интеллекте и его влиянии на индустрию, поэтому маловероятно, что будет затронута тема новых графических ускорителей GeForce. Посетить выступление главы Nvidia можно будет бесплатно, оно также будет транслироваться в режиме онлайн. Отметим, что доклад Nvidia не является частью основных мероприятий, запланированных в рамках Computex. На официальном сайте Computex выступление Хуанга не отмечено, как официальное, и нет никаких упоминаний о тайваньском мероприятии. Что касается непосредственно Computex, то вступительный доклад 3 июня сделает гендиректор AMD Лиза Су (Lisa Su). В этот же день слово возьмёт глава Qualcomm Кристиано Амон (Cristiano Amon). На следующей день пройдёт выступление главы Intel Пэта Гелсингера (Pat Gelsinger). Также уже анонсированы выступления руководителей MediaTek, SuperMicro, NXP и Delta GD. Китай продолжает получать подсанкционные ускорители Nvidia, но окольными путями и в составе серверов
23.04.2024 [10:10],
Алексей Разин
Осенью прошлого года под действие американских правил экспортного контроля попал широкий ассортимент ускорителей вычислений Nvidia, а также игровая видеокарта GeForce RTX 4090, которую китайские умельцы приспособили для работы в серверных системах. Расследование Reuters показывает, что санкционная продукция Nvidia продолжает поставляться в Китай.
Источник изображения: Nvidia Агентство использовало для получения подобных выводов общедоступную конкурсную документацию, в которой отображались состоявшиеся закупки серверного оборудования, в составе которого содержались запрещённые к экспорту в Китай компоненты Nvidia. По словам представителей Reuters, уже после вступления новых ограничений в середине ноября прошлого года не менее 10 китайских учреждений смогли получить серверное оборудование, содержащее «запрещённые» ускорители Nvidia. В закупках фигурировали серверные системы Super Micro Computer, Dell Technologies и Gigabyte Technology. В выборку попали конкурсные процедуры, которые проводились в период с 20 ноября прошлого года по 28 февраля текущего. Среди 11 поставщиков, выигравших конкурсные процедуры на поставку «запрещённой» вычислительной техники в Китай, все были малоизвестными торговыми компаниями из КНР, как поясняет Reuters. Поставляли ли они оборудование из запасов, сформированных до вступления в силу осенних изменений к правилам экспортного контроля, определить не удалось. Представители Nvidia заявили, что даже если указанные поставки и осуществлялись в обход санкций США, они составляют лишь малую часть оборота мирового рынка, и никак не дискредитируют ни саму компанию, ни её партнёров. Получателями оборудования по рассматриваемым конкурсам выступали государственные ВУЗы КНР и правительственные организации, а также пара исследовательских центров, работающих в аэрокосмической отрасли. Представители Super Micro заверили, что собственные требования компании к соблюдению правил экспортного контроля с запасом превосходят по строгости государственные, а поставленное в Китай оборудование относилось к прошлому поколению, которое под санкции США ранее не попадало. Китайские поставщики, которые участвовали в конкурсе, клиентами Super Micro не являлись. Dell разбирается в ситуации, но на момент подготовки материала к печати заявила, что не располагает доказательствами поставки запрещённого к экспорту в Китай оборудования в адрес упоминаемых агентством Reuters китайских организаций и компаний. Gigabyte Technology просто заявила, что соблюдает международные правила торговли и законы Тайваня. По информации Reuters, в конкурсной документации не конкретизировались конечные сферы применения приобретаемого оборудования, а суммы закупок варьировались от $10 000 до $259 000. Microsoft к концу года хочет накопить 1,8 млн GPU, преимущественно Nvidia
22.04.2024 [13:11],
Алексей Разин
Среди игроков облачного рынка становится нормой упоминать планы по закупкам ускорителей вычислений, которые способны влиять на производительность создаваемых компаниями систем искусственного интеллекта. Некоторые делают это публично, другие в закрытых презентациях, и последний из каналов позволяет нам узнать, что Microsoft к концу текущего года хочет утроить количество эксплуатируемых ускорителей до 1,8 млн штук.
Источник изображения: Microsoft О наличии таких планов у Microsoft со ссылкой на служебную документацию корпорации сообщил на прошлой неделе ресурс Business Insider. В документе сообщается, что Microsoft рассчитывает увеличить закупки ускорителей вычислений на основе GPU в три раза по сравнению с прошлым годом, и к декабрю располагать примерно 1,8 млн соответствующих ускорителей, преимущественно поставленных компанией Nvidia. К сентябрю 2027 года Microsoft собирается потратить на покупку ускорителей и оснащение своих центров обработки данных около $100 млрд, как отмечается в том же документе. В отдельном документе ранее сообщалось, что уже во второй половине прошлого года Microsoft достигла рекордного количества эксплуатируемых ускорителей на базе GPU, хотя точное значение и не называлось. Аналитики DA Davidson считают, что в прошлом году только на ускорители Nvidia корпорация Microsoft потратила $4,5 млрд. Близкие к Microsoft источники смогли подтвердить Business Insider, что эта сумма близка к реальной. Поскольку в планы компании входит утроение закупок ускорителей, и продукцией только Nvidia она ограничиваться не собирается, легко предположить, что затраты текущего года будут измеряться в десятках миллиардов долларов США. В начале этого года Марк Цукерберг (Mark Zuckerberg) уже заявлял, что в текущем году Meta✴✴ Platforms собирается купить около 350 000 ускорителей Nvidia H100, и в целом это поможет ей увеличить количество эксплуатируемых ускорителей этой модели до 600 000 штук. Получается, что Microsoft замахивается на количество ускорителей, измеряемое как минимум одним миллионом штук. Samsung сможет начать поставки HBM3E до конца текущего полугодия
22.04.2024 [09:13],
Алексей Разин
Ещё по итогам мартовской конференции GTC 2024, если верить публикации в социальной сети LinkedIn главы американского представительства Samsung Electronics, основатель Nvidia Дженсен Хуанг (Jensen Huang) одобрил использование микросхем памяти типа HBM3E этой корейской марки своими ускорителями вычислений. Теперь стало известно, что их поставки могут начаться до конца текущего полугодия.
Источник изображения: LinkedIn Новости на эту тему в минувшую пятницу опубликовал южнокорейский ресурс Maeil Business Newspaper. Сейчас, как уточняет источник, микросхемы HBM3E компании Samsung в 8- и 12-ярусном исполнении проходят последние фазы тестирования, и серийные поставки для нужд Nvidia могут начаться уже до конца первого полугодия. Если учесть, что аналитики предрекали начало поставок либо в третьем квартале, либо даже в четвёртом, то подобный сценарий на этом фоне кажется более оптимистичным. Способность Nvidia использовать 12-слойные стеки памяти типа HBM3E позволит компании увеличить объём памяти своих ускорителей вычислений, по этой причине продукция Samsung должна быть ею востребована. Кроме того, наличие в ассортименте продукции этого поставщика 8-слойных микросхем HBM3E позволит Nvidia претендовать на более привлекательные цены за счёт усиления конкуренции с SK hynix. В целом, во втором полугодии это может привести к снижению цен на микросхемы памяти HBM3E. Акции технологических компаний показали снижение — Nvidia потеряла 10 %
20.04.2024 [15:51],
Павел Котов
Фондовые рынки США пережили крупнейший спад с октября 2022 года: инвесторы отказались от ставок на отрасль искусственного интеллекта и покупки рискованных активов в преддверии квартальных отчётов технологических компаний, которые ожидаются на следующей неделе, пишет Financial Times.
Источник изображения: Tumisu / pixabay.com Nvidia пережила худшую торговую сессию с марта 2020 года, за день потеряв более $200 млрд рыночной стоимости — снижение акций компании на 10 % приняло на себя более половины падения индекса S&P 500, которое составило 0,9 %. Netflix за день лишилась около 9 % стоимости после того, как руководство сервиса заявило, что прекратит регулярно раскрывать число своих подписчиков. Технологический Nasdaq Composite завершил сессию снижением на 2,1 %. Пострадали и акции компаний, которые выросли благодаря энтузиазму инвесторов в отношении ИИ: AMD (-5,4 %), Micron (-4,6 %), Meta✴✴ (-4,1 %) и Super Micro Computer (-23 %).
Динамика индексов S&P 500 и Nasdaq Composite. Источник изображения: ft.com Пятничное крушение связано с тем, что инвесторы всерьёз допустили возможность снижения процентной ставки ФРС всего на четверть пункта в этом году или даже её сохранение на текущем уровне. Их беспокойство усилило очередное обострение ближневосточного конфликта. Аналитики также объяснили пятничную распродажу активов тем, что инвесторы перепрофилировали свои портфели в преддверии серии отчётов крупных технологических компаний о доходах. На следующей неделе о финансовых результатах за I квартал доложат Microsoft, Alphabet и Meta✴✴; отчёт Nvidia будет опубликован в конце мая. Ожидается, что все они продемонстрируют хорошие результаты, но сравнение квартала к кварталу обещает быть не столь радужным. Годовой рост прибыли на акцию Nvidia, Meta✴✴, Microsoft, Amazon, Alphabet и Apple достиг пика в IV квартале 2023 года, составив 68,2 %. За первые три месяца этого года данный показатель «большой шестёрки», как ожидается, будет 42,1 %. Nvidia представила профессиональные видеокарты RTX A1000 и RTX A400 с трассировкой лучей
16.04.2024 [20:48],
Николай Хижняк
Компания Nvidia представила профессиональные видеокарты начального уровня RTX A1000 и RTX A400. Обе новинки основаны на чипах с архитектурой Ampere, выполненных по 8-нм техпроцессу Samsung. Новинки пришли на замену моделям T1000 и T400, выпущенным 2021 году. Примечательной особенностью новых карт является поддержка ими технологии трассировки лучей, которая отсутствовала у предшественников.
Источник изображения: Nvidia В модели RTX A1000 используется урезанный графический процессор GA107 с 2304 ядрами CUDA и 72 тензорными ядрами, работающий на частоте 1460 МГц. Карта получила 8 Гбайт памяти GDDR6 со скоростью 12 Гбит/с на контакт и поддержкой 128-битной шины, для которой заявляется пропускная способность на уровне 192 Гбайт/с. Показатель энергопотребления новинки составляет 50 Вт, что соответствует предшественнику.
Источник изображения: AnandTech В свою очередь, RTX A400 получила графический процессор с 768 ядрами CUDA и 24 тензорными ядрами, работающий на частоте 1755 МГц. Ускоритель получил 4 Гбайт памяти GDDR6 со скоростью 12 Гбит/с на контакт поддержкой 64-битной шины, для которой заявляется пропускная способность на уровне 96 Гбайт/с или вдвое меньше, чем у RTX A1000. Любопытно, что при этом показатель энергопотребления у младшей модели составляет всё те же 50 Вт, когда предшественник использовал лишь 30 Вт. Обе карты оснащены активными системами охлаждения с одним вентилятором. Толщина новинок составляет один слот расширения. Обе карты получили по четыре разъёма mini-DisplayPort 1.4a. Помимо разницы в производительности RTX A1000 и RTX A400 отличаются в видеовозможностях. Старшая модель получила два блока декодирования NVDEC, у RTX A400 — имеется только один такой блок. По словам Nvidia, RTX A1000 появится в ассортименте её партнёров начиная с сегодняшнего дня. В свою очередь, RTX A400 появится у дистрибьюторов в мае. Ожидается, что OEM-производители ПК и рабочих станций начнут предлагать установку этих видеокарт летом. Выход Nvidia Blackwell увеличит спрос на передовую упаковку чипов TSMC CoWoS более чем на 150 % в 2024 году
16.04.2024 [18:32],
Павел Котов
В этом году Nvidia выпустит семейство ускорителей вычислений нового поколения Blackwell, в котором будут представлены решения как с одними лишь графическими процессорами, например B100 и B200, так и решения, сочетающие графический процессор и центральный Arm-процессор собственной разработки — Blackwell GB200. Выход новых чипов Nvidia значительно увеличит спрос на упаковку чипов по передовой технологии TSMC CoWoS, уверены аналитики TrendForce.
Источник изображения: nvidia.com Если на долю ускорителей GH200 приходились лишь 5 % поставок высокопроизводительных GPU Nvidia, то с GB200 этот показатель к 2025 году вырастет до 40–50 %. Nvidia планирует наладить выпуск GB200 и B100 во второй половине года, для упаковки чипов потребуется сложная и высокоточная технология CoWoS-L, которая сделает процесс тестирования трудоёмким. Потребуется дополнительное время для оптимизации серии Blackwell для серверных систем искусственного интеллекта в таких аспектах как сетевое соединение и показатели охлаждения. Как ожидается, производство продуктов GB200 и B100 в значительных объемах начнётся не раньше IV квартала 2024 или I квартала 2025 года. Выпуск ускорителей GB200, B100 и B200 потребует увеличения ёмкости линий по упаковке чипов CoWoS. Ожидается, что TSMC к концу года увеличит их производительность до почти 40 тыс. чипов в месяц — это рост на 150 % по сравнению с прошлым годом. К 2025 году запланированная общая мощность может почти удвоиться, при этом, как ожидается, спрос со стороны Nvidia составит более половины от этой мощности. Другие поставщики, такие как Amkor и Intel, в настоящее время сосредоточены на технологии CoWoS-S, в первую очередь ориентированной на H-серию Nvidia.
Источник изображения: trendforce.com Аналитики TrendForce также определили три основные тенденции развития направления памяти HBM для продуктов Nvidia и AMD после 2024 года. Во-первых, ожидается переход от HBM3 к HBM3e. Во второй половине 2024 года Nvidia начнёт наращивать поставки ускорителей H200, оснащённых HBM3e, которые заменят H100 в качестве основного продукта. Далее последуют модели GB200 и B100 также с HBM3e. AMD же к концу года выпустит новый ускоритель MI350, который могут предварять промежуточные модели, такие как MI32x, направленные на конкуренцию с H200 — все они получат HBM3e. Во-вторых ёмкость HBM будет расти. Сегодня используются преимущественно ускорители Nvidia H100 с 80 Гбайт памяти — к концу 2024 года будут уже 192–288 Гбайт. Ускоритель AMD MI300A получил 128 Гбайт памяти, но и «красные» нарастят ёмкость до 288 Гбайт. В-третьих, память HBM3e сменит конфигурацию со стеков 8Hi (8 кристаллов DRAM уложенных друг на друга) до 12Hi. Модели Nvidia B100 и GB200 в настоящее время оснащаются HBM3e 8Hi ёмкостью 192 Гбайт, а к 2025 году модель B200 получит HBM3e 12Hi ёмкостью 288 Гбайт. Ускоритель AMD MI350, который появится к концу этого года, и ожидаемая в 2025 году серия MI375, как ожидается, получат HBM3e 12Hi также объёмом 288 Гбайт. Коннекторы питания видеокарт GeForce RTX 4090 по-прежнему плавятся под нагрузкой — одна мастерская заменила 200 штук за месяц
13.04.2024 [01:25],
Николай Хижняк
Коннекторы и переходники питания видеокарт GeForce RTX 4090 продолжают плавиться. Проблема никуда не ушла, даже спустя год после выпуска данных видеокарт. Компания Nvidia в конце концов обновила коннекторы питания с оригинальных 12VHPWR на новые 12V-2×6, однако проблема с их повреждением под нагрузкой снова привлекла внимание, когда компания CableMod выпустила кастомные адаптеры питания на их основе.
Источник изображений: YouTube / NorthridgeFix В конечном итоге CableMod отозвала из продажи угловые адаптеры питания и предложила возместить их стоимость покупателям. Кроме того, компания взяла на себя обязательства возместить ущерб, причинённый видеокартам. Он, согласно анализу, составил порядка $74 тыс. Ещё до официального отзыва переходников питания CableMod сталкивалась со случаями их плавления. Производители перекладывали вину друг на друга и в итоге обвинили во всём поставщиков кабелей питания и адаптеров. Поддерживать подобный продукт стало невозможно. По мнению NorthridgeFix, занимающейся ремонтом видеокарт, CableMod на самом деле сделала хороший продукт. Однако он был построен на изначально плохой основе: новом стандарте 12VHPWR, который также называют 12+4-контактным или 16-контактным разъёмом. Сейчас Nvidia поставляет все свои видеокарты GeForce RTX 40-й серии с новым коннектором 12V-2×6. Он имеет более короткие сигнальные контакты, которые предотвращают подачу дополнительного питания на GPU, если коннектор не до конца вставлен в разъём. Но даже несмотря на это, сервисный центр продолжает получать повреждённые в результате расплавления коннекторов питания видеокарты GeForce RTX 40-й серии. По информации NorthridgeFix, за прошлый месяц они поменяли порядка 200 подобных сгоревших коннекторов. В подтверждении своих слов сотрудник компании показал целую коробку сгоревших и в последствии заменённых разъёмов. Правда, в опубликованном NorthridgeFix видео не уточняется, какие именно это коннекторы — старого или нового образца. Nvidia и партнёры рекомендуют использовать вместе с видеокартами GeForce RTX 40-й серии только родные переходники, входящие в комплект поставки самих видеокарт, либо родные кабели питания, входящие в комплекты поставок блоков питания. Любые сторонние адаптеры и коннекторы питания несут риск перегрева и расплавления, особенно, когда коннектор неправильно подключён к разъёму. Владельцы видеокарт GeForce RTX 40-й серии и особенно RTX 4090, которые в некоторых случаях могут потреблять 600 Вт под нагрузкой, должны более внимательно следить за состоянием коннекторов питания на своих графических ускорителях. На видео, опубликованном NorthridgeFix, также демонстрируется процесс демонтажа повреждённого коннектора питания и замена на новый. Хотелось бы верить, что Nvidia более внимательно отнесётся к проблеме плавления разъёмов при разработке своих видеокарт GeForce RTX нового поколения. Те же AMD и Intel ранее заявили, что не планируют использовать в своих будущих видеокартах коннекторы питания 12VHPWR и 12V-6X2 из-за их ненадёжности. Сроки поставок ИИ-ускорителей Nvidia H100 сократились до 2–3 месяцев
10.04.2024 [20:59],
Николай Хижняк
Cроки поставок ИИ-ускорителей Nvidia H100 сократились с 3–4 до 2–3 месяцев (8–12 недель), сообщает DigiTimes со ссылкой на заявление директора тайваньского офиса компании Dell Теренса Ляо (Terence Liao). ODM-поставщики серверного оборудования отмечают, что дефицит специализированных ускорителей начал снижаться по сравнению с 2023 годом, когда приобрести Nvidia H100 было практически невозможно.
Источник изображения: Nvidia По словам Ляо, несмотря на сокращение сроков выполнения заказов на поставки ИИ-ускорителей, спрос на это оборудование на рынке по-прежнему чрезвычайно высок. И несмотря на высокую стоимость, объёмы закупок ИИ-серверов значительно выше закупок серверного оборудования общего назначения. Окно поставок в 2–3 месяца — это самый короткий срок поставки ускорителей Nvidia H100 за всё время. Всего шесть месяцев назад он составлял 11 месяцев. Иными словами, клиентам Nvidia приходилось почти год ждать выполнение своего заказа. С начала 2024 года сроки поставок значительно сократились. Сначала они упали до 3–4 месяцев, а теперь до 2–3 месяцев. При таком темпе дефицит ИИ-ускорителей может быть устранён к концу текущего года или даже раньше. Частично такая динамика может быть связана с самими покупателями ИИ-ускорителей. Как сообщается, некоторые компании, имеющие лишние и нигде не использующиеся H100, перепродают их для компенсации огромных затрат на их приобретение. Также нынешняя ситуация может являться следствием того, что провайдер облачных вычислительных мощностей AWS упростил аренду ИИ-ускорителей Nvidia H100 через облако, что в свою очередь тоже частично помогает снизить на них спрос. Единственными клиентами Nvidia, которым по-прежнему приходится сталкиваться с проблемами в поставках ИИ-оборудования, являются крупные ИИ-компании вроде OpenAI, которые используют десятки тысяч подобных ускорителей для быстрого и эффективного обучения своих больших языковых ИИ-моделей. Акции Nvidia упали на 10 % по сравнению с недавним историческим максимумом
10.04.2024 [19:50],
Сергей Сурабекянц
Nvidia вступила на «территорию коррекции»: её акции упали на 10 % по сравнению с последним историческим максимумом в $950 за акцию. Во вторник торги закрылись на отметке $853,54, падение за сессию составило 2 %. Аналитики связывают снижение стоимости акций Nvidia c представленным накануне компанией Intel ИИ-ускорителем Gaudi 3, «сокращением» моделей ИИ и перенаправлением инвестиций крупных клиентов на разработку собственного оборудования для ИИ.
Источник изображения: Nvidia Nvidia за последние годы стала ключевым бенефициаром бума искусственного интеллекта благодаря ажиотажному спросу на её чипы, предназначенные для ресурсоёмких приложений ИИ. Ускорители компании являются ключевым компонентом множества центров обработки данных. Nvidia сообщила о росте в четвёртом квартале разводненной прибыли на акцию (non-GAAP) на 486 % благодаря беспрецедентной популярности генеративных моделей искусственного интеллекта. Однако последние две недели акции компании находятся под давлением. Падение курса ценных бумаг составило 10 % по сравнению с последним историческим максимумом, которого они достигли 25 марта. Сегодня акции Nvidia торговались с понижением на 0,7 % по состоянию на 9:45 утра по времени восточного побережья США (16:45 мск). Финансовые эксперты советуют инвесторам фиксировать прибыль, которая может составить более чем 200 % за последние 12 месяцев.
Источник изображения: cnbc.com Одной из возможных причин понижения курса акций Nvidia аналитики называют «сокращение» моделей искусственного интеллекта, включая альтернативы, такие как большая модель Mistral и система LLaMA от Meta✴✴. «Сочетание сокращения моделей, более устойчивого роста спроса, зрелых инвестиций в гиперскейлеры и растущего использования крупнейшими клиентами собственных чипов не сулит ничего хорошего для Nvidia в ближайшие годы», — полагают эксперты аналитической компании D.A. Davidson. Конкуренция в сфере ускорителей вычислений нарастает. Во вторник компания Intel представила свой новый чип для ускорения искусственного интеллекта под названием Gaudi 3. По утверждению компании, новый чип более чем в два раза энергоэффективнее, чем H100 — самый популярный из ныне выпускаемых ускорителей Nvidia, и может запускать модели искусственного интеллекта в 1,5 раза быстрее, чем H100. Хотя консенсус-оценки говорят о том, что спрос на графические процессоры Nvidia для технологий искусственного интеллекта в этом году будет высоким, в 2025 году ожидается замедление роста, а в 2026 году аналитики предрекают значительный спад для Nvidia, так как крупные покупатели чипов искусственного интеллекта, такие как Amazon и Microsoft, вероятно, направят большую часть своих инвестиций в собственное оборудование. США закрыли лазейки для обхода санкций против технологического сектора Китая, России и других стран
09.04.2024 [20:10],
Владимир Чижевский
29 марта США объявили об очередных поправках к правилам экспортного контроля передовых вычислительных систем, суперкомпьютеров и полупроводниковых продуктов. Обновлённые правила вступили в силу 4 апреля и призваны усложнить обход ограничений отдельными странами и компаниями. Главным образом санкции призваны ограничить технологическое развитие Китая.
Источник изображения: NVIDIA Новые поправки уточняют формулировки и ужесточают условия экспорта технологий в Макао, Китай, Северную Корею, Россию, Иран и другие страны категории D:5. Возможность экспорта продуктов, превышающих определённые пороги вычислительной мощности, рассматривается отдельно в каждом конкретном случае. Новое положение, Advanced Computing Authorized (ACA), разрешает экспорт и транзит определённых товаров через Макао и страны D:5. Под новые ограничения попадут не только ранее запрещённые к экспорту в упомянутые страны NVIDIA A100/H100, AMD MI250/300, NVIDIA A800, H800, L40, L40S и RTX 4090, но и ускорители нового поколения, среди которых NVIDIA H200, B100, B200, GB200 и AMD MI350. Производители уже разработали новые продукты, соответствующие обновлённым правилам экспорта, например, NVIDIA H20, L20 и L2. Также игровая GeForce RTX 4090D не попала под ограничения. Поскольку поправки направлены на устранение лазеек в существующих нормативных актах, а не создание новых серьёзных препятствий для экспорта технологий, едва ли они заметно повлияют на индустрию. В долгосрочной перспективе США намерены всё сильнее ограничивать доступ Китая к передовым технологиям, что может привести к обратному эффекту и подстегнуть Китай к ускоренной разработке собственных технологий. У видеокарт GeForce RTX выгорает краска на бэкплейтах — вероятно, дело в подсветке оперативной памяти
08.04.2024 [20:11],
Владимир Чижевский
Несколько человек с Reddit поделились необычной проблемой, возникшей у их видеокарт GeForce RTX — краска на их тыльных усиливающих пластинах выгорела весьма специфическим образом, намекающим на воздействие подсветки модулей оперативной памяти ПК.
MSI RTX 3080 Ti. Источник изображения: ychii93 / Reddit Современные модули оперативной памяти нередко комплектуются яркой RGB-подсветкой со множеством эффектов. Некоторые светодиоды с высоким индексом цветопередачи могут излучать свет в ультрафиолетовом спектре с длиной волны от 375 до 400 нм, воздействие которого приводит к выгоранию краски. Пока имеются сведения о выгорании краски с бэкплейтов видеокарт у двух пользователей MSI GeForce RTX 3080 и одного пользователя Gigabyte GeForce RTX 4080. Ещё один пользователь продемонстрировал аналогичный эффект на пластине Asus GeForce GTX 1080 Ti, но отметил, что видеокарте уже пять лет. Один из сообщивших о проблеме заменил видеокарту и тут же заметил проявление похожих следов на бэкплейте нового GPU, и это наводит на мысль, что всему виной действительно подсветка оперативной памяти. Усиление санкций США не помешает Nvidia поставлять в Китай видеокарты GeForce RTX 4090D
05.04.2024 [04:48],
Алексей Разин
Накануне вступили в силу новые правила экспортного контроля США, которые уточняют возникшие ещё в октябре прошлого года ограничения на поставку в Китай отдельных вычислительных средств. Методика расчёта производительности вычислительных систем была дополнена, но фактически она не повлияла на способность Nvidia поставлять в Китай видеокарты GeForce RTX 4090D и ускорители H20.
Источник изображения: Nvidia Напомним, оба указанных изделия Nvidia были разработаны компанией уже с учётом осенних санкций, причём если первое формально является игровой видеокартой, то второе исключительно нацелено на рынок высокопроизводительных вычислений. Ресурс Tom’s Hardware рискнул в числе первых броситься в пучину бюрократических формулировок, которыми изобилуют опубликованные властями США накануне новые дополнения к правилам экспортного контроля, и добиться истины удалось только со второй попытки, причём при непосредственной помощи со стороны самой Nvidia. Вполне очевидно, что вводя изменения в текст правил экспортного контроля, американские чиновники предварительно советовались с Nvidia, поэтому заявлениям представителей компании можно доверять. Упоминаемые в пояснениях к новым правилам экспортного контроля термины «скорректированная пиковая производительность» и «средневзвешенное значение в терафлопсах» применяются для оценки быстродействия целых вычислительных систем, а не отдельных ускорителей или видеокарт. Соответственно, порог в 70 терафлопс не ограничивает возможности Nvidia или её партнёров поставлять в Китай видеокарты GeForce RTX 4090D, как первоначально решили многие. Кроме того, требования американских регуляторов относятся к вычислительным системам с равноправным доступом к общей памяти на условиях когерентности. Предельная производительность в вычислениях FP64, описываемая в правилах экспортного контроля, учитывает тип используемого процессора: векторный или скалярный, применяя соответствующий масштабный коэффициент. Если для векторных процессоров, коими считаются GPU, этот коэффициент равен 0,9, то для скалярных он не превышает 0,3. То есть, на практике «запретных» 67 терафлопс на систему в средневзвешенном исчислении могут достичь только довольно производительные решения типа сочетания из четырёх Nvidia H100, которые к поставкам в Китай давно запрещены. GeForce RTX 4090D по этой методике набирает не более 1,15 терафлопс средневзвешенной производительности в вычислениях FP64, а потому её поставки в Китай ограничены быть не могут, если учитывать существующие правила контроля со стороны США. |
|
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |