[情報] 輝達澄清:4090D不受美國出口管制限制

作者: AquaChen1012 (小麥慎二)   2024-04-05 18:18:52
NVIDIA 「澄清」美國出口管制
GeForce RTX 4090 D 將不受此限
路透社 3 日報導,美國商務部上月 29 日再次更新高科技出口管制要求,在 ECCN 4A003
0.C 條文中追加了全新限制,超過 70 TFLOPS 都不能出口中國。但 NVIDIA 4 日主動通
知國外媒體,重新澄清指 ECCN4A0030.C 條文的一些字眼被混淆和誤解,並確認 GeForce
RTX 4090 D 與 H20 GPU 將不受新限制所影響。
據 Tom's Hardware 5 日報導,ECCN4A0030.C 條文中有閞於「調整後峰值性能」(APP)
和「加權萬億次浮點運算」(WT),限制為 70 TFLOPS 或更低,只適用於「具有記憶體一
致性 (Memory Consistency) 的系統」,而不是單一 GPU,例如 4 路 DGX H100 系統就
屬於此分類。
NVIDIA 主動通知媒體時指出,要符合 ECCN4A0030.C 新修定的要求,該晶片是需要能透
過快取或記憶體定址,以硬體方式來存取系統中的任何記憶體位置,而不需要任何軟體機
制的參與,因此 GPU 並不受這項條文所規範。
過快取或記憶體定址,以硬體方式來存取系統中的任何記憶體位置,而不需要任何軟體機
制的參與,因此 GPU 並不受這項條文所規範。
此外,條文中另一個重要細節是「調整後峰值性能」只適用於經「加權」的 FP64 吞吐量
,因為該值根據它是向量處理器還是標量(非向量)處理器進行縮放。換句話說,透過 N
vidia Tensor 核心等向量單元完成的 FP64 與透過運行 64 位元計算的 CPU 完成的 FP6
4 不同。
而要確定「加權 teraflops」和「調整後的峰值性能」兩項數值,是需要計算系統的 FP6
4 總吞吐量。然後,對於向量處理器乘以 0.9,或對於非向量處理器則乘以 0.3。回到以
4 路 DGX H100 的系統為例,GPU 的 H100 SXM 的向量 FP64 吞吐量為 67 teraflops,
四路合共可提供 268 teraflops 總吞吐量,再乘以 0.9 則得到 241.2 teraflops,因而
遠高於 70 加權 teraflops 限制。
GeForce RTX 4090 D 幾乎無法提供任何 FP64 吞吐量,只有 1.15 TFLOPS,儘管它仍然
接近 4,800 TPP 限制,但 NVIDIA GeForce RTX 4090 D 因此並沒有被禁止出口。
http://i.imgur.com/Rr9Wj9a.jpg
本來前幾天傳出
4090D賣不了中國
可能改賣其他地方
不過
5090都要出了
除非定價45K
不然也沒人想買

Links booklink

Contact Us: admin [ a t ] ucptt.com