核心頻率:1304 MHz
Turbo頻率:1442 MHz
流處理單元:3584 個
核心架構:Pascal
GPU代號:GP100
生產工藝:16 nm
TDP功耗:235W
內存頻率:1430 Mbps
內存類型:HBM2
內存位寬:4096 bit
最大顯存:16 GB
晶體管數量:15,300 million
代工廠:TSMC
核心面積:610 mm2
一級緩存:24 KB
二級緩存:4 MB
光柵單元:224
紋理單元:96
SM count:56
建議電源:550 W
公版供電:1x 8-pin
公版接口:1x DVI4x DisplayPort
總線接口:PCIe 3.0 x16
像素填充率:138.4 GPixel/s
紋理填充率:323.0 GTexel/s
顯存帶寬:732.2 GB/s
FP16:20.67 TFLOPS (2:1)
FP32:10.34 TFLOPS
FP64:5.168 TFLOPS (1:2)
DirectX:12 (12_1)
OpenGL:4.6
OpenCL:3.0
Vulkan:1.2
CUDA:6.0
Shader model:6.4
GP100容易讓人誤會,它并非是核心名,而品名就是Quadro GP100,作為這一家族的旗艦登場。Quadro GP100基于Pascal核心,單精度CUDA 3584個,雙精度CUDA 1792個,半精/單精/雙精浮點運算性能分別是20.7T、10.3T和5.2T,匹配16GB HBM2顯存,帶寬高達717GB/s,功耗235W。
GP100 提供超過 20 TFLOPS 的半精度計算,可謂在 Windows 和 Linux 環境中進行深度學習的理想開發平臺。
GP100是帕斯卡家族的旗艦核心,預計桌面上的GTX 1080 Ti、新版GTX Titan X也會使用它。
它采用臺積電16nm FinFET工藝制造,集成了153億個晶體管,比麥克斯韋GM200多了超過90%,核心面積達610平方毫米,只比28nm工藝的GM200大了區區9平方毫米。
完整的GP100核心擁有60個SM(流式多處理器)單元,Tesla P100只開啟了其中的56個。每個SM單元內有64個FP32單精度CUDA核心(麥克斯韋、開普勒架構分別有128個、192個),總計3840個。
每個SM單元分為兩部分,每部分有32個FP32 CUDA核心、一個指令緩沖器、一個Warp調度器、兩個分派單元。
GP100核心每個SM單元的CUDA核心數量雖然只有麥克斯韋架構的一半,但是擁有相同的寄存器文件尺寸(256KB),支持類似的Warp和線程模塊。
GP100核心的每個SM單元內還有32個FP64雙精度CUDA核心,總計1920個,是單精度的1/2,這種比例可以更好地配合GP100核心新的數據路徑配置,更高效地處理雙精度負載。
GP100核心還有統一的4096KB二級緩存,超過開普勒GK110 1536KB、麥克GM200 3702KB,可以減少對GPU DRAM的請求,從而降低整體功耗、內存帶寬,提升性能。
整個核心還配備了240個紋理單元。
您的電子郵件地址不會被公開,必填項已用 * 標注。
提交評論
Δ
? ? ? ? ? ? ? ?Copyright 2020-2025 IT存儲營 粵ICP備2021121885號網站地圖