Накануне вступили в силу новые правила экспортного контроля США, которые уточняют возникшие ещё в октябре прошлого года ограничения на поставку в Китай отдельных вычислительных средств. Методика расчёта производительности вычислительных систем была дополнена, но фактически она не повлияла на способность Nvidia поставлять в Китай видеокарты GeForce RTX 4090D и ускорители H20.
Напомним, оба указанных изделия Nvidia были разработаны компанией уже с учётом осенних санкций, причём если первое формально является игровой видеокартой, то второе исключительно нацелено на рынок высокопроизводительных вычислений. Ресурс Tom’s Hardware рискнул в числе первых броситься в пучину бюрократических формулировок, которыми изобилуют опубликованные властями США накануне новые дополнения к правилам экспортного контроля, и добиться истины удалось только со второй попытки, причём при непосредственной помощи со стороны самой Nvidia.
Вполне очевидно, что вводя изменения в текст правил экспортного контроля, американские чиновники предварительно советовались с Nvidia, поэтому заявлениям представителей компании можно доверять. Упоминаемые в пояснениях к новым правилам экспортного контроля термины «скорректированная пиковая производительность» и «средневзвешенное значение в терафлопсах» применяются для оценки быстродействия целых вычислительных систем, а не отдельных ускорителей или видеокарт. Соответственно, порог в 70 терафлопс не ограничивает возможности Nvidia или её партнёров поставлять в Китай видеокарты GeForce RTX 4090D, как первоначально решили многие. Кроме того, требования американских регуляторов относятся к вычислительным системам с равноправным доступом к общей памяти на условиях когерентности.
Предельная производительность в вычислениях FP64, описываемая в правилах экспортного контроля, учитывает тип используемого процессора: векторный или скалярный, применяя соответствующий масштабный коэффициент. Если для векторных процессоров, коими считаются GPU, этот коэффициент равен 0,9, то для скалярных он не превышает 0,3. То есть, на практике «запретных» 67 терафлопс на систему в средневзвешенном исчислении могут достичь только довольно производительные решения типа сочетания из четырёх Nvidia H100, которые к поставкам в Китай давно запрещены. GeForce RTX 4090D по этой методике набирает не более 1,15 терафлопс средневзвешенной производительности в вычислениях FP64, а потому её поставки в Китай ограничены быть не могут, если учитывать существующие правила контроля со стороны США.