NVIDIA A100 SXM4 40 GB vs NVIDIA A40 PCIe
Was ist der Unterschied zwischen NVIDIA A100 SXM4 40 GB und NVIDIA A40 PCIe. Finden Sie heraus, welche Grafikkarte die bessere Leistung hat.
Grafikprozessor (GPU)
| GA100 | GPU-Name | GA102 |
| Ampere | Architektur | Ampere |
| TSMC | Hersteller | Samsung |
| 7 nm | Fertigungsprozess | 8 nm |
| 54,200 million | Transistor-Anzahl | 28,300 million |
| 826 mm² | Chipgröße (reiner Die) | 628 mm² |
Grafikkarte
| May 14th, 2020 | Markteinführungsdatum | Oct 5th, 2020 |
| Tesla (Axx) | Produktfamilie | Tesla (Axx) |
| Active | Produktionsstatus | Active |
| PCIe 4.0 x16 | Schnittstelle | PCIe 4.0 x16 |
Speicher
| 40 GB | Max. Speichergröße | 48 GB |
| HBM2e | Grafikspeicher-Typ | GDDR6 |
| 5120 bit | Speicherschnittstelle | 384 bit |
| 1,555 GB/s | Speicherbandbreite | 695.8 GB/s |
Leistung
| 225.6 GPixel/s | Pixel-Füllrate | 194.9 GPixel/s |
| 609.1 GTexel/s | Textur-Füllrate | 584.6 GTexel/s |
| 77.97 TFLOPS (4:1) | FP16-Berechnung | 37.42 TFLOPS (1:1) |
| 19.49 TFLOPS | FP32-Berechnung | 37.42 TFLOPS |
| 9.746 TFLOPS (1:2) | FP64-Berechnung | 1,169 GFLOPS (1:32) |
Taktraten
| 1095 MHz | Basisfrequenz | 1305 MHz |
| 1410 MHz | Boost-Frequenz | 1740 MHz |
| 1215 MHz 2.4 Gbps effective | Grafikspeicher Taktfrequenz | 1812 MHz 14.5 Gbps effective |
Renderkonfiguration
| 6912 | Stream-Prozessoren / CUDA-Recheneinheiten | 10752 |
| 432 | TMUs | 336 |
| 160 | ROPs | 112 |
| 192 KB (per SM) | L1-Cache | 128 KB (per SM) |
| 40 MB | L2-Cache | 6 MB |
| 108 | Shader-Cluster (SMs) | 84 |
| 432 | Tensor-Kerne | 336 |
Kompatibilität und Abmessungen
| IGP | Grafikkarten Bauform | Dual-slot |
| 400 W | Max. Stromverbrauch | 300 W |
| 800 W | Netzteil (Empfehlung) | 700 W |
| No outputs | Anschlüsse der Grafikkarte | 3x DisplayPort |
| None | Zusätzlicher Stromanschluss | 8-pin EPS |
API-Unterstützung
| N/A | DirectX | 12 Ultimate (12_2) |
| N/A | OpenGL | 4.6 |
| 3.0 | OpenCL | 3.0 |
| N/A | Vulkan | 1.2 |
| N/A | Shader-Model | 6.6 |
| 8.0 | CUDA | 8.6 |