[情報] NV公佈帕斯卡架構白皮書:GP100完全曝光

作者: ultra120 (原廠打手 !!!)   2016-04-25 09:21:57
關於下代架構“帕斯卡”(Pascal)的產品,NVIDIA目前只宣布了一款大核心的高性能計算
卡Tesla P100
其他各種GeForce遊戲卡都還得等一段時間,不過近日,NVIDIA很慷慨地公佈了一份帕斯
卡架構白皮書
幾乎完全公開了GP100核心與Tesla P100的各種規格。
GP100是帕斯卡家族的旗艦核心,預計桌面上的GTX 1080 Ti、新版GTX Titan X也會使用
它。
它採用台積電16nm FinFET工藝製造,集成了153億個晶體管,比麥克斯韋GM200多了超過
90%
核心面積達610平方毫米,只比28nm工藝的GM200大了區區9平方毫米。
完整的GP100核心擁有60個SM(流式多處理器)單元,Tesla P100只開啟了其中的56個。
每個SM單元內有64個FP32單精度CUDA核心 (麥克斯韋、開普勒架構分別有128個、192個)
,總計3840個。
每個SM單元分為兩部分,每部分有32個FP32 CUDA核心、一個指令緩衝器、一個Warp調度
器、兩個分派單元。
GP100核心每個SM單元的CUDA核心數量雖然只有麥克斯韋架構的一半
但是擁有相同的寄存器文件尺寸(256KB),支持類似的Warp和線程模塊。
GP100核心的每個SM單元內還有32個FP64雙精度CUDA核心,總計1920個,是單精度的1/2
這種比例可以更好地配合GP100核心新的數據路徑配置,更高效地處理雙精度負載。
GP100核心還有統一的4096KB二級緩存,超過開普勒GK110 1536KB、麥克GM200 3702KB
可以減少對GPU DRAM的請求,從而降低整體功耗、內存帶寬,提升性能。整個核心還配備
了240個紋理單元。
Tesla P100計算卡擁有3584個FP32單精度、1792個FP64雙精度CUDA核心,核心基礎頻率
1328MHz
加速頻率高達1480MHz,峰值單精度性能10600GFlops,比起上代提升了足足55%
而雙精度性能也達到了5300GFlops,是開普勒架構的3.2倍,更是麥克斯韋架構的25.2倍

它搭配了4096-bit HBM2高帶寬顯存,容量16GB,熱設計功耗300W。
來源︰http://news.mydrivers.com/1/479/479502.htm
完全公開,等待上市
作者: speedshuffle (咻~)   2016-04-25 17:36:00
電晶體就電晶體在那邊晶體管不知道跑4K-VR如何

Links booklink

Contact Us: admin [ a t ] ucptt.com