Опрос
|
реклама
Быстрый переход
Акции NVIDIA подорожали втрое с начала года и на этой неделе обновили исторический максимум
23.08.2023 [10:00],
Алексей Разин
Квартальная отчётность NVIDIA будет опубликована завтра, а с начала прошлой недели курс акций компании уже вырос на 12 % в ожидании воодушевляющих результатов. По итогам вчерашней торговой сессии курс опустился на 2,77 % до $456,68 за акцию, но в ходе торгов он успел достичь исторического максимума на отметке $481,87. Всего же с начала этого года акции NVIDIA выросли в цене на 219 %. ![]() Источник изображения: NVIDIA Как отмечает Bloomberg, занимая удельный вес 3,2 % и 4,3 % соответственно в индексах S&P 500 и Nasdaq 100, акции NVIDIA своей динамикой во многом способствовали росту этих индексов в текущем году. Первый, например, с начала года вырос на 14 %. Как ожидается, в годовом сравнении выручка NVIDIA за второй квартал выросла на 65 % и превысила $11 млрд, преимущественно за счёт высокого спроса на ускорители для систем искусственного интеллекта. В начале этой недели только ленивый аналитик не высказался оптимистично по поводу перспектив дальнейшего роста курса акций NVIDIA, поэтому обновление исторического максимума можно считать закономерным результатом. Дальнейшая динамика курса акций компании будет во многом зависеть от тех заявлений, которые будут сделаны руководством на квартальном отчётном мероприятии. При этом, как показывает практика, на перегретом рынке будет достаточно самых незначительных негативных факторов, чтобы вызвать снижение курса. Сейчас соотношение стоимости одной акции NVIDIA к удельному доходу достигает 44, заметно превышая норму за десятилетний период (32). По мнению аналитиков Goldman Sachs, акции NVIDIA входят в число ценных бумаг 11 компаний, которые в ближайшее время явно выиграют от «революции в сфере искусственного интеллекта». Эти ценные бумаги 11 компаний в среднем с начала года подорожали на 69 %, тогда как индекс S&P 500 за тот же период вырос всего на 14,7 %. NVIDIA наделила эмоциями неигровых персонажей в играх с помощью ИИ
23.08.2023 [00:21],
Николай Хижняк
На выставке Computex 2023 компания NVIDIA представила платформу Avatar Cloud Engine (ACE) for Games, которая позволит сделать умнее неигровых персонажей (NPC) в играх. Представленный инструмент даёт возможность разработчикам создавать собственные ИИ-модели, которые позволят генерировать для NPC естественную речь, диалоги, а также движения. За минувшие месяцы с момента анонса платформы NVIDIA её усовершенствовала, научив создавать эмоциональных персонажей. ![]() Источник изображения: NVIDIA В рамках изначальной демонстрации работы технологии ACE компания показала интерактивную демо-сцену Kairos с неигровым персонажем Джином, владельцем лапшичной, созданную на движке Unreal Engine 5 с технологией трассировки лучей. Сегодня NVIDIA отчиталась, что интегрировала в платформу ACE ИИ-модель NVIDIA NeMo SteerLM. Она позволяет разработчикам игр изменять характер неигровых персонажей, делая их более эмоциональными и реалистичными, что позволяет человеку сильнее погрузиться в мир игры. Большинство языковых моделей (LLM) разработаны с целью давать только нейтральные ответы. Они лишены возможности эмоциональных имитаций и личностных поведенческих особенностей. Типичным примером таких LLM являются ИИ-чат-боты. В свою очередь с помощью SteerLM языковые модели обучаются давать ответы, соответствующие определённым атрибутам характера, от юмора до креативности и токсичности. При этом все особенности характера NPC можно настроить всего лишь движением нескольких ползунков в интерфейсе SteerLM. С примером использования SteerLM и результатами работы можно ознакомиться на видео ниже, в рамках всё той же интерактивной демо-сцены NVIDIA Kairos. Как можно заметить, ответы NPC значительно отличаются, в зависимости от выбранных атрибутов характера и уровня интенсивности. Неигровой персонаж может обидеться на реплику игрока, попытаться более подробно объяснить ситуацию, а также сделать это с юмором и креативностью. При использовании NVIDIA NeMo SteerLM можно изменять существующие черты характера, а также добавлять новые, создавая по-настоящему уникальных неигровых интерактивных персонажей под определённую сцену в игре или локацию. Эмоциональный отклик — не единственный вариант использования SteerLM в играх. С помощью этой технологии разработчики могут создавать сразу несколько персонажей, используя одну LLM. Кроме того, разработчики могут создавать так называемые атрибуты фракций, чтобы согласовать реакции тех или иных NPC с развитием внутриигровой истории, позволяя неигровым персонажам динамически изменяться в характере с учётом изменяющихся событий в игре. В приведенной выше демо-сцене для озвучивания неигрового персонажа Джина использовался синтезатор текста в речь ElevenLabs. С помощью ACE разработчики могут добавлять свои собственные компоненты в конвейер ACE, расширяя его возможности. NVIDIA выпустила драйвер GeForce Game Ready 537.13 WHQL с поддержкой Starfield
22.08.2023 [16:58],
Николай Хижняк
Компания NVIDIA выпустила свежий пакет графического драйвера GeForce Game Ready 537.13 WHQL. В него добавлена поддержка игры Starfield, а также дополнения New Frontiers для игры Icarus. ![]() Источник изображения: Bethesda Softworks Список исправленных проблем:
Список известных проблем:
Новый драйвер также содержит исправление проблем со стабильностью работы приложений для создания цифрового контента, вызванных чрезмерной загрузкой памяти. Однако в некоторых случаях установка указанного обновления приводит к снижению производительности в Stable Diffusion и DaVinci Resolve. Эти проблемы будут исправлены в будущих обновлениях драйвера. Скачать драйвер GeForce Game Ready 537.13 WHQL можно с официального сайта NVIDIA или через приложение GeForce Experience. NVIDIA анонсировала ИИ-масштабирование DLSS 3.5 с реконструкцией лучей
22.08.2023 [13:31],
Павел Котов
NVIDIA анонсировала технологию интеллектуального масштабирования изображения DLSS 3.5, важнейшим преимуществом которой стала реконструкция трассировки лучей (Ray Reconstruction) — нейросеть, заменяющая стандартные алгоритмы шумоподавления. ![]() Источник изображений: nvidia.com Трассировка лучей для каждого пикселя на изображении — чрезвычайно требовательная к ресурсам задача даже для профессиональных приложений, от которых не требуется обработка данных в реальном времени. Поэтому применяются обходные методы, такие как просчёт лучей по образцам: трассировка производится для отдельных точек сцены, число которых достаточно велико для получения репрезентативной выборки освещения, отражательной способности и затемнённых участков. ![]() Алгоритмы подавления шума чреваты потерей качества и детализации На выходе получается сильно зашумлённое изображение, но его достаточно, чтобы оценить, как должна выглядеть сцена при полноценной трассировке лучей. Чтобы получить результаты по всем пикселям, производится временная и пространственная интерполяции — по сути, алгоритм шумоподавления «крадёт» лучи из прошлого и смешивает пиксели с соседними, что чревато понижением качества картинки, например, возникновением «ореолов», и потерей детализации. ![]() Ray Reconstruction обладает рядом преимуществ перед шумоподавителями Решением проблемы является технология реконструкции лучей — она подменяет стандартные подавители шума нейросетью, при обучении которой использовалось в пять раз больше данных, чем при разработке DLSS 3, а образцами служили изображения, получение которых в реальном времени было бы невозможным. Нейросеть распознаёт различные эффекты трассировки лучей, принимая более разумные решения для интерполяции по времени и пространству — она обучена различать «плохие» и «хорошие» пиксели, благодаря чему обеспечивается более качественный результат. Технология работает совместно с другими решениями NVIDIA: алгоритмом DLSS Super Resolution, который выстраивает 4K-изображения по образцу более низкого разрешения, а также DLSS Frame Generation (только для видеокарт серии NVIDIA GeForce RTX 40) — он генерирует дополнительные промежуточные кадры на основе соседних, повышая тем самым плавность движения. Дебют NVIDIA DLSS 3.5 состоится этой осенью. Технология дебютирует в играх Cyberpunk 2077: Phantom Liberty, Portal with RTX и Alan Wake 2, а также в программах NVIDIA Omniverse, Chaos Vantage и D5 Renderer. Санкции США начнут замедлять развитие систем ИИ в Китае лишь через несколько лет
22.08.2023 [10:01],
Алексей Разин
В сентябре прошлого года власти США запретили поставлять в Китай самые передовые ускорители вычислений. Компания NVIDIA вынуждена была быстро выпустить на местный рынок ограниченные по скорости передачи данных ускорители A800, которые не подпадают под санкции, а в текущем году к ним присоединились «замедленные» H800. Эксперты считают, что китайские разработчики систем искусственного интеллекта упрутся в ограничения США лишь через несколько лет. ![]() Источник изображения: NVIDIA Издание Financial Times вполне наглядно поясняет логику этого умозаключения с помощью примера со строительством предприятий. Если разделённые некоторым расстоянием промышленные кластеры сами по себе будут наращивать производительность, а дороги для их сообщения сохранят прежнюю пропускную способность, то именно они в перспективе нескольких лет станут сдерживающим фактором развития. В случае с ускорителями вычислений, допущенными на китайский рынок, назревает именно такая ситуация. Как отмечает первоисточник, главный научный советник NVIDIA Билл Далли (Bill Dally) считает, что отставание китайских разработчиков от всего остального мира будет стремительно расти хотя бы в силу удвоения потребности в производительности передовых систем ИИ каждые шесть или двенадцать месяцев. Санкции США осенью прошлого года ограничили поставки в Китай ускорителей вычислений американского происхождения, которые обеспечивают передачу информации со скоростью свыше 600 Гбайт/с. По данным Lenovo, новейшие ускорители NVIDIA H100 в своём немодифицированном состоянии способны передавать информацию со скоростью 900 Гбайт/с, а H800 для Китая обладают скоростью передачи не выше 400 Гбайт/с. На практике это означает, что китайские разработчики будут больше времени тратить на тренировку языковых моделей, и со временем это приведёт к более выраженному отставанию от западных конкурентов. По оценкам экспертов, H800 даже с учётом этих ограничений по уровню своей производительности всё равно в пять раз быстрее немодифицированных A100, поэтому спрос на первые в Китае продолжает сохраняться на высоком уровне. Тем более, что особых альтернатив решениям NVIDIA в этом сегменте рынка почти нет. Как сообщалось ранее, крупнейшие китайские клиенты уже сформировали заказы на ускорители вычислений NVIDIA на общую сумму $5 млрд. При этом решения NVIDIA хоть и являются очень дорогими, но всё равно остаются самыми выгодными, потому как альтернативы предлагают меньшую производительность, ограничены в поставках, а также важным плюсом ускорителей NVIDIA является продвинутая программная платформа. Санкции США в их нынешнем виде не лишают китайские компании доступа к ускорителям вычислений и разработке систем ИИ полностью, но создают условия для увеличения отставания от западных конкурентов. Через два или три года китайские разработчики могут столкнуться с тем, что не смогут эффективно тренировать новые языковые модели с помощью доступных им аппаратных ресурсов. Любую видеокарту GeForce теперь можно прошить любым BIOS — энтузиасты смогли взломать защиту NVIDIA
21.08.2023 [14:55],
Николай Хижняк
Начиная GeForce GTX 900-й серии (Maxwell) компания NVIDIA использует в своих видеокартах встроенный сопроцессор безопасности под кодовым именем Falcon. Он предотвращает загрузку GPU с неавторизованной прошивкой BIOS. Как пишет портал TechPowerUp, два энтузиаста независимо друг от друга разработали инструменты, которые позволяют прошить практически любой BIOS на практически любую видеокарту NVIDIA GeForce, обходя защиту от неавторизованной модификации. ![]() Источник изображения: Tom's Hardware Инструменты называются OMGVflash и NVflashk. Возможности этих утилит практически безграничны. Например, с их помощью можно установить BIOS видеокарты с заводским разгоном на модель, в которой такого разгона нет. Помимо изменения тактовых частот GPU, модификация BIOS позволяет повышать максимальный порог энергопотребления, что оказывает более существенное влияние на производительность, поскольку увеличивает разгонный потенциал. Кроме того, модификация BIOS позволяет управлять напряжениями GPU, охлаждением и кривой работы вентилятора, что позволяет сделать видеокарту более тихой, если только кулер способен удержать GPU от тепловых ограничений, которые также можно регулировать. Например, можно восстановить напряжение 1,1 В на графическом процессоре у флагманской GeForce RTX 4090. Изначально такое напряжение было зарезервировано для ранних серийных RTX 4090. Однако с появлением графического процессора AD102-301 максимальное напряжение было установлено на уровне 1,07 В. Создатель инструмента OMGVflash, энтузиаст с псевдонимом Veii, опубликовал на форуме TechPowerUp обширную тему, в которой сообщается о первой публичной бета-версии утилиты, истории её разработки, инструкциях по использованию и некоторых способах устранения неполадок. Аналогичную тему на форуме TechPowerUp создал автор утилиты NVflashk. NVIDIA продаёт ИИ-ускорители H100 с наценкой в 1000 %, но спрос на них только растёт
17.08.2023 [23:02],
Николай Хижняк
NVIDIA получает до 1000 % выручки с каждого проданного специализированного графического ускорителя H100, предназначенного для задач, связанных с искусственным интеллектом. Об этом утверждает журналист издания Barron Тэ Ким (Tae Kim), ссылающийся на анализ консалтинговой компании Raymond James. ![]() Источник изображения: NVIDIA В настоящий момент стоимость каждого ускорителя NVIDIA H100 в зависимости от региона продаж и поставщика в среднем составляет $25–30 тыс. При этом речь идёт о менее дорогой PCIe-версии указанного решения. По оценкам Raymond James, стоимость использующегося в этом ускорителе графического процессора, а также дополнительных материалов (печатной платы и других вспомогательных элементов) составляет $3320. К сожалению, Ким не уточняет глубину анализа расчёта стоимости и не поясняет, включены ли в этот показатель такие факторы, как затраты на разработку, зарплата инженеров, а также стоимость производства и логистики. Разработка специализированных ускорителей требует значительного времени и ресурсов. По данным того же портала Glassdoor, средняя зарплата инженера по аппаратному обеспечению в NVIDIA составляет около $202 тыс. в год. Речь идёт только об одном инженере, но очевидно, что при разработке тех же H100 работала целая команда специалистов, а на саму разработку были затрачены тысячи рабочих часов. Всё это должно учитываться в конечной стоимости продукта. И всё же очевидно, что сейчас NVIDIA в вопросе поставок аппаратных средств для ИИ-вычислений находится вне конкуренции. На специализированные ускорители «зелёных» сейчас такой спрос, что они распродаются ещё задолго до того, как попадают на условные полки магазинов. Поставщики говорят, что очередь за ними растянулась до второго квартала 2024 года. А с учётом последних оценок аналитиков, согласно которым к 2027 году рынок ИИ-вычислений вырастет до $150 млрд, ближайшее будущее NVIDIA видится точно безбедным. С другой стороны, для рынка в целом высокий спрос на ускорители ИИ-вычислений имеет свои негативные последствия. В последних отчётах аналитиков говорится, что продажи традиционных серверов (HPC) в глобальном масштабе сокращаются. Основная причина падения спроса заключается в том, что гиперскейлеры и операторы ЦОД переключают внимание на системы, оптимизированные для ИИ, в которых используются решения вроде NVIDIA H100. По этой причине тем же производителям памяти DDR5 пришлось пересмотреть свои ожидания относительно распространения нового стандарта ОЗУ на рынок, поскольку операторы ЦОД сейчас активно инвестируют именно в ускорители ИИ, а не в новый стандарт оперативной памяти. На фоне этого ожидается, что уровень внедрения DDR5 достигнет паритета с DDR4 только к третьему кварталу 2024 года. Nvidia сократит поставки GPU для десктопных видеокарт в пользу мобильных чипов
16.08.2023 [16:27],
Николай Хижняк
Компания NVIDIA рассматривает возможность перенаправить часть своих поставок графических процессоров для настольных видеокарт в сегмент ноутбуков, чтобы удовлетворить огромный спрос на последние в Китае, сообщают китайские источники. Это может обернуться дефицитом GPU для десктопного сегмента, но такой сценарий кажется маловероятным. ![]() Источник изображения: TechSpot По данным китайских источников, NVIDIA вместо того, чтобы увеличить объёмы выпуска графических чипов для ноутбуков для удовлетворения очень высокого спроса на последние, хочет перенаправить часть своих мощностей для производства некоторых моделей десктопных графических процессоров из серии Ada Lovelace в цепочку поставок для мобильного сегмента. В частности, речь идёт о GPU для видеокарт GeForce RTX 4060 и RTX 4070. С апреля этого года ходят слухи, что NVIDIA столкнулась с низким спросом на десктопные видеокарты RTX 4070 и хотела сократить их выпуск. Неизвестно, действительно ли в итоге компания решилась на этот шаг. Но даже если так, то никакого видимого эффекта на рынок это не произвело. Модели RTX 4060 и RTX 4060 Ti тоже не пользуются особым спросом в десктопном сегменте. Всё это означает, что на складах скопилось огромное количество дорогих видеокарт, для реализации которых многим розничным сетям приходится проводить различные акции и предлагать скидки. Если NVIDIA действительно перенаправит часть производимых GPU указанных выше моделей видеокарт в мобильный сегмент, то ограниченное предложение в десктопном сегменте позволит ей избавиться от затоваривания и сохранить высокие цены на ускорители. Рынок прекрасно помнит времена, когда нехватка видеокарт приводила к значительному росту их стоимости. Цены некоторых версий GeForce RTX 30-й серии превышали рекомендованные в три и более раз. Пандемия COVID-19, дефицит чипов и высокие цены на криптовалюту в какой-то момент буквально озолотили продавцов графических ускорителей. С другой стороны, нехватка RTX 4060 и RTX 4070 в десктопном сегменте вряд ли окажется столь же заметной, поскольку на них отмечается очень низкий спрос. Также не стоит забывать о ожидаемых видеокартах Radeon RX 7800 и RX 7700, которые станут прямыми конкурентами вышеуказанным моделям GeForce RTX. Более того, новые решения AMD, вероятно, смогут предложить даже лучший уровень производительности по более низкой цене. По слухам, новые модели Radeon среднего ценового сегмента будут представлены в ходе игрового мероприятия Gamescom 2023, проведение которого запланировано на следующую неделю. В итоге это может побудить NVIDIA снизить цены на свои RTX 4060, RTX 4060 Ti и RTX 4070. Арабские разработчики начали тысячами скупать ускорители вычислений NVIDIA для своих систем искусственного интеллекта
15.08.2023 [08:27],
Алексей Разин
В гонку по созданию передовых систем генеративного искусственного интеллекта бросились целые государства. По информации источников Financial Times, разработчики из Саудовской Аравии и ОАЭ тысячами закупают передовые ускорители NVIDIA H100, чтобы развивать собственную экосистему в этой сфере. Воодушевление инвесторов по этому поводу в целом вчера привело к росту курса акций NVIDIA на 7 %. ![]() Источник изображения: NVIDIA Как сообщает первоисточник, Саудовская Аравия уже закупила партию как минимум из 3000 ускорителей NVIDIA H100, рыночная стоимость каждого достигает $40 000. Разработчики из ОАЭ стараются не отставать от соседей по макрорегиону, и не только закупают такие ускорители тысячами штук, но и разрабатывают собственную языковую модель Falcon. Основные ресурсы для успеха в этой сфере у поддерживаемого властями Technology Innovation Institute в Абу-Даби имеются: это и денежные средства, и энергоресурсы, и возможность привлекать квалифицированные кадры по всему миру. По неофициальным оценкам, TSMC по итогам текущего года сможет выпустить не более 550 000 ускорителей NVIDIA H100, причём приоритет будет отдаваться обслуживанию заказов американских компаний. Прочим клиентам в этой ситуации достанется не так много, поэтому они активно соперничают за право получить желаемые ускорители. Разработчики в Саудовской Аравии намереваются строить свои суперкомпьютеры не только на базе H100, но и уже имеющихся в их распоряжении ускорителей A100. Кроме того, ими будут применяться представленные недавно NVIDIA гибридные ускорители семейства Grace Hopper. В профильных проектах на территории Саудовской Аравии надеются найти применение своим талантам китайские специалисты, которые в результате введённых США санкций не смогли устроиться там на работу. В ОАЭ разработчики тренировали языковую модель Falcon на ресурсах 384 ускорителей NVIDIA A100 в течение двух с небольшим месяцев, и результат этой работы впечатлил экспертов. Власти страны приняли участие в закупке нескольких тысяч ускорителей NVIDIA для интенсификации работы на этом направлении. Они также пытались выйти на зарубежные стартапы с целью организации взаимовыгодного сотрудничества, но пока успехов не добились. Аналитики Morgan Stanley подняли прогноз по курсу акций NVIDIA до $500 за штуку. Заказами на ускорители вычислений, по их словам, компания обеспечена на три или четыре квартала вперёд. До второй половины следующего года будет сохраняться дефицит производственных мощностей. По этой причине эксперты не завышают прогноз по выручке NVIDIA на текущий квартал. Если в минувшем квартале она достигла $11 млрд, по предварительным оценкам, то в текущем в лучшем случае вырастет до $12 или $13,5 млрд. В целом, за последующие несколько кварталов выручка NVIDIA в серверном сегменте вполне может по итогу достичь $15 млрд, как считают представители Morgan Stanley. Очередь за ускорителями вычислений NVIDIA H100 растянулась до 2024 года
10.08.2023 [10:26],
Алексей Разин
Ажиотажный спрос на ускорители вычислений NVIDIA для систем искусственного интеллекта уже привёл к дефициту данного вида продукции, и старшая карта H100 с архитектурой Hopper востребована в такой степени, что все доступные объёмы таких ускорителей уже распределены до начала следующего года. ![]() Источник изображения: NVIDIA По крайней мере, уверенность в этом в интервью ресурсу Barron’s выразил технический директор стартапа CoreWeave Брайан Вентуро (Brian Venturo), поскольку приближённый к NVIDIA поставщик инфраструктурных решений для ускорения вычислений силами GPU имеет актуальное представление о положении дел на рынке. Как пояснил Брайан Вентуро, ещё в первом квартале текущего года с доступом к нужным объёмам ускорителей проблем не было, но в апреле всё резко изменилось. Сроки исполнения заказов растянулись до конца текущего года, и спрос неожиданно подскочил буквально за одну неделю. Ускорители теперь нужны не только крупным облачным провайдерам, но и исследовательским лабораториям, и крупным предприятиям, которые экспериментируют с внедрением систем искусственного интеллекта. Как поясняет этот поставщик ускорителей, сейчас желающие получить самую производительную версию в исполнении NVIDIA, которая обозначается H100, вынуждены рассчитывать сроки поставки на первый или второй квартал следующего года. Непосредственно CoreWeave, инвестором которой является сама NVIDIA, сможет возобновить закупку ускорителей серии H100 не ранее второго или третьего квартала следующего года. По словам руководителя компании, решения NVIDIA в этой сфере востребованы в силу наличия развитой экосистемы для разработчиков, универсальности и сопутствующей инфраструктуры передачи информации в виде скоростных решений InfiniBand. Китайские интернет-гиганты заказали ускорителей NVIDIA на $5 млрд в ожидании новых санкций
10.08.2023 [05:12],
Алексей Разин
С осени прошлого года NVIDIA лишилась права поставлять в Китай полноценные версии своих ускорителей A100 и H100, поэтому она в сжатые сроки наладила поставки урезанных по быстродействию чипов A800 и H800. Ожидая дальнейшего усиления санкций со стороны США, китайские клиенты компании уже оплатили авансом $5 млрд, покрывая свои потребности в ускорителях не только на этот год, но и на следующий. ![]() Источник изображения: NVIDIA По крайней мере, в таком свете выставляет ситуацию издание Financial Times. Со ссылкой на собственные источники оно сообщает, что Baidu, ByteDance, Tencent и Alibaba сообща заказали почти 100 000 ускорителей A800 на общую сумму $1 млрд, и рассчитывают получить их в текущем году. Поставки следующего года тоже оплачены на сумму $4 млрд. Помимо опасений по поводу усугубления санкций со стороны США, китайские клиенты NVIDIA стимулируют авансовые платежи в условиях высокого спроса на ускорители для систем искусственного интеллекта, создающего дефицит компонентов данного типа. ByteDance удалось заказать около 10 000 ускорителей NVIDIA, в следующем году китайская компания, владеющая социальной сетью TikTok, рассчитывает получить не менее 700 000 ускорителей A800 на сумму почти $700 млн. Представители китайских компаний, упоминаемых в материале, комментировать ситуацию отказались, а NVIDIA лишь пояснила, что многомиллиардные авансовые платежи в этом сегменте рынка являются обычной практикой. Спрос на ускорители A800 на китайском рынке, по данным некоторых источников, увеличил их локальную стоимость более чем на 50 % по сравнению с началом этого года. Tencent в апреле представила серверные кластеры на основе более современных ускорителей NVIDIA H800, доступных китайским клиентам в текущих обстоятельствах. Alibaba для своего облачного бизнеса тоже закупила несколько тысяч таких ускорителей, как сообщают источники. ByteDance использует в своих системах не только A800, но и попавшие под санкции A100. Последние, возможно, используются из старых запасов, либо приобретаются обходными путями. Стоимость ускорителей для китайских потребителей в данном случае может кратно превышать рекомендованную NVIDIA. Сотрудничество NVIDIA и ИИ-стартапа Hugging Face поможет упростить облачное обучение ИИ-моделей
09.08.2023 [04:25],
Владимир Мироненко
Чипмейкер NVIDIA объявил на ежегодной конференции SIGGRAPH 2023 о партнёрстве со стартапом в области ИИ Hugging Face. В рамках партнёрства NVIDIA обеспечит поддержку новой услуги Hugging Face под названием Training Cluster as a Service (Кластер обучения как услуга), которая упростит создание и настройку новых пользовательских генеративных моделей ИИ для корпоративных клиентов, использующих собственную платформу и NVIDIA DGX Cloud для инфраструктуры, делая это одним щелчком мыши. ![]() Источник изображения: Hugging Face Запуск сервиса Training Cluster as a Service намечен на ближайшие месяцы. Он будет базироваться на DGX Cloud, облачном ИИ-суперкомпьютере NVIDIA, предлагающем выделенные ИИ-кластеры NVIDIA DGX с ПО NVIDIA. DGX Cloud предоставляет доступ к инстансу с восемью ускорителями NVIDIA H100 или A100 и 640 Гбайт памяти, а также ПО NVIDIA AI Enterprise для разработки приложений ИИ и больших языковых моделей (LLM). Также предоставляется возможность консультирования у экспертов NVIDIA. Разработчики также получат доступ к новой рабочей среде NVIDIA AI Workbench, которая позволит им быстро создавать, тестировать и настраивать предварительно обученные модели генеративного ИИ и LLM. Компании могут подписаться на сервис DGX Cloud самостоятельно — стоимость инстансов DGX Cloud начинается от $36 999/мес. Однако сервис Training Cluster as a Service объединяет облачную инфраструктуру DGX с платформой Hugging Face, включающей более 250 000 моделей и более 50 000 наборов данных, что будет полезно при работе над любым проектом ИИ. По словам гендиректора Hugging Face Клемана Деланга (Clément Delangue), платформу стартапа использует более 15 000 компаний. NVIDIA представила профессиональные видеокарты RTX 5000 Ada, RTX 4500 Ada и RTX 4000 Ada стоимостью $1250–4000
09.08.2023 [00:14],
Николай Хижняк
Компания NVIDIA в рамках конференции SIGGRAPH 2023 представила три новые видеокарты для рабочих станций, расширившие ассортимент профессиональных графических ускорителей на архитектуре Ada Lovelace: RTX 5000 Ada, RTX 4500 Ada и RTX 4000 Ada. ![]() RTX 5000 Ada. Источник изображений: NVIDIA В основе модели RTX 5000 Ada используется графический процессор AD102 с 12 800 ядрами CUDA, 400 тензорными ядрами и 100 RT-ядрами. Чип работает на частоте 2,5 ГГц. Карта получила 32 Гбайт памяти GDDR6 с функцией коррекции ошибок ECC, скоростью 18 Гбит/с на контакт, поддержкой 256-битной шины и пропускной способностью 578 Гбайт/с. Энергопотребление ускорителя составляет 250 Вт. Для RTX 5000 компания указывает производительность в операциях FP32 на уровне 65,3 Тфлопс. В составе модели RTX 4500 Ada используется графический процессор AD104 с 7680 ядрами CUDA, 240 тензорными ядрами и 60 RT-ядрами. Для GPU заявляется Boost-частота в 2,6 ГГц. Карта получила 24 Гбайт памяти GDDR6 с функцией коррекции ошибок ECC, скоростью 18 Гбит/с на контакт, поддержкой 192-битной шины и пропускной способностью 432 Гбайт/с. Энергопотребление ускорителя составляет 210 Вт, а производительность в операциях FP32 находится на уровне 39,6 Тфлопс. Модель RTX 4000 Ada получила графический процессор AD104 с 6144 ядрами CUDA, 192 тензорными и 48 RT ядрами. Чип работает на частоте 2,2 ГГц. Карта оснащена 20 Гбайт памяти GDDR6 с функцией коррекции ошибок ECC, скоростью 18 Гбит/с на контакт, поддержкой 160-битной шины и пропускной способностью 360 Гбайт/с. Для новинки указывается энергопотребление в 130 Вт и производительность в операциях FP32 на уровне 26,7 Тфлопс. ![]() Источник изображения: ComputerBase Все представленные карты поддерживают 16 линий интерфейса PCIe 4.0. Старшие модели получили по четыре видеовыхода DisplayPort 1.4a. Модель RTX 4000 Ada оснащена четырьмя разъёмами mini-DisplayPort 1.4a. NVIDIA оценила модель RTX 5000 Ada в $4000, модель RTX 4500 Ada — в $2250, а младшую RTX 4000 Ada — в $1250. Первые рабочие станции, оснащенные указанными профессиональными графическими ускорителями, должны появиться в продаже осенью этого года. Среди предложений будут представлены рабочие станции от Boxx, Dell, Lambda, Lenovo и HP. В продаже в том числе появятся рабочие станции, предлагающие до четырёх ранее представленных профессиональных ускорителей RTX 6000 Ada с 48 Гбайт памяти GDDR6 ECC стоимостью $6800 каждый. NVIDIA выпустила драйвер с поддержкой DLSS 2 в Baldur’s Gate 3
08.08.2023 [22:54],
Николай Хижняк
Компания NVIDIA выпустила свежий пакет графического драйвера GeForce Game Ready 536.99 WHQL. В него добавлена поддержка новых игр, работающих с технологией масштабирования изображения NVIDIA DLSS 2. В частности, речь идёт о Baldur’s Gate 3, The Texas Chain Saw Massacre и Gord. ![]() Источник изображения: Larian Studios Список исправленных проблем:
Список известных проблем:
Новый драйвер также содержит исправление проблем со стабильностью работы приложений для создания цифрового контента, вызванных чрезмерной загрузкой памяти. Однако в некоторых случаях установка указанного обновления приводит к снижению производительности в Stable Diffusion и DaVinci Resolve. Эти проблемы будут исправлены в будущих обновлениях драйвера. Скачать драйвер GeForce Game Ready 536.99 WHQL можно с официального сайта NVIDIA или через приложение GeForce Experience. NVIDIA представила суперчип GH200 Grace Hopper с памятью HBM3e и производительностью 4 Пфлопс
08.08.2023 [22:17],
Николай Хижняк
Компания NVIDIA в рамках конференции SIGGRAPH 2023 представила вычислительную платформу GH200 Grace Hopper SuperChip нового поколения, представляющую собой двухчиповую систему из центрального и графического процессоров. Она послужит для построения НРС-систем и ИИ-платформ. В её основе используется новое поколение суперчипа NVIDIA Grace, оснащённого набортной высокопроизводительной памятью HBM3e, обеспечивающей доступ к информации со скоростью 5 Тбайт/с. ![]() Источник изображения: NVIDIA По словам NVIDIA, платформа GH200 Grace Hopper SuperChip нового поколения значительно превосходит по производительности своего предшественника. Один сервер на платформе GH200 Grace Hopper с двумя новыми суперчипами (то есть с двумя парами GPU+CPU) сможет предложить наличие 144 ядер Arm Neoverse, работающих в тандеме с 282 Гбайт передовой набортной высокопроизводительной памяти HBM3e. Такая конфигурация обеспечивает в 3,5 раза больше памяти и в три раза больше пропускной способности, чем предшественник. Производительность подобной платформы с парой суперчипов составляет 8 петафлопс. «Для удовлетворения растущего спроса на генеративный ИИ центрам обработки данных требуются вычислительные платформы с особыми возможностями. Этот вопрос готова решить новая платформа GH200 Grace Hopper SuperChip, в которой применяется технология набортной памяти HBM3e с повышенной пропускной способностью. Она предлагает возможность объединения нескольких GPU для объединения производительности, а также позволяет создавать серверные системы, которые можно легко развернуть в любом месте центра обработки данных», — прокомментировал глава NVIDIA Дженсен Хуанг (Jensen Huang). Суперчип Grace Hopper, лежащий в основе новой платформы, может быть объединён с такими же суперчипами с помощью шины NVIDIA NVLink. Эта высокоскоростная технология предоставляет графическому процессору полный доступ к памяти центрального процессора, обеспечивая суммарно 1,2 Тбайт быстрой памяти в случае конфигурации с двумя суперчипами. Это позволяет развёртывать крупномасштабные вычислительных системы, необходимые для решения комплексных задач, связанных с генеративными ИИ. Память стандарта HBM3e, использующаяся в составе платформы GH200 Grace Hopper SuperChip нового поколения, обладает на 50 % более высокой производительностью по сравнению с HBM3 и обеспечивает совокупную пропускную способность на уровне 10 Тбайт/с в системе с несколькими платформами GH200 Grace Hopper SuperChip. Это позволяет платформе запускать в 3,5 раза более крупные ИИ-модели и обеспечивает значительный прирост общей производительности за счёт увеличенной в три раза пропускной способности памяти по сравнению с предшественником. В NVIDIA отмечают, что на фоне растущего спроса на платформу Grace Hopper ведущие производители уже начали предлагать системы, построенные на базе суперчипа Grace Hopper. Новая платформа Grace Hopper SuperChip следующего поколения с памятью HBM3e полностью совместима со спецификациями серверной модульной архитектуры NVIDIA MGX, которая была представлена на выставке Computex 2023. Такая совместимость гарантирует, что любой производитель серверных решений сможет быстро и с минимальными затратами интегрировать Grace Hopper в более чем 100 вариантов серверов, представленных на рынке. Внедрние новой платформы NVIDIA ведущими производителями серверных систем начнётся во втором квартале 2024 года. |