NVIDIA A100 PCIe 80 GB vs NVIDIA A40 PCIe
Was ist der Unterschied zwischen NVIDIA A100 PCIe 80 GB und NVIDIA A40 PCIe. Finden Sie heraus, welche Grafikkarte die bessere Leistung hat.
Grafikprozessor (GPU)
| GA100 | GPU-Name | GA102 |
| Ampere | Architektur | Ampere |
| TSMC | Hersteller | Samsung |
| 7 nm | Fertigungsprozess | 8 nm |
| 54,200 million | Transistor-Anzahl | 28,300 million |
| 826 mm² | Chipgröße (reiner Die) | 628 mm² |
Grafikkarte
| Jun 28th, 2021 | Markteinführungsdatum | Oct 5th, 2020 |
| Tesla (Axx) | Produktfamilie | Tesla (Axx) |
| Active | Produktionsstatus | Active |
| PCIe 4.0 x16 | Schnittstelle | PCIe 4.0 x16 |
Speicher
| 80 GB | Max. Speichergröße | 48 GB |
| HBM2e | Grafikspeicher-Typ | GDDR6 |
| 5120 bit | Speicherschnittstelle | 384 bit |
| 2,039 GB/s | Speicherbandbreite | 695.8 GB/s |
Leistung
| 225.6 GPixel/s | Pixel-Füllrate | 194.9 GPixel/s |
| 609.1 GTexel/s | Textur-Füllrate | 584.6 GTexel/s |
| 77.97 TFLOPS (4:1) | FP16-Berechnung | 37.42 TFLOPS (1:1) |
| 19.49 TFLOPS | FP32-Berechnung | 37.42 TFLOPS |
| 9.746 TFLOPS (1:2) | FP64-Berechnung | 1,169 GFLOPS (1:32) |
Taktraten
| 1065 MHz | Basisfrequenz | 1305 MHz |
| 1410 MHz | Boost-Frequenz | 1740 MHz |
| 1593 MHz 3.2 Gbps effective | Grafikspeicher Taktfrequenz | 1812 MHz 14.5 Gbps effective |
Renderkonfiguration
| 6912 | Stream-Prozessoren / CUDA-Recheneinheiten | 10752 |
| 432 | TMUs | 336 |
| 160 | ROPs | 112 |
| 192 KB (per SM) | L1-Cache | 128 KB (per SM) |
| 80 MB | L2-Cache | 6 MB |
| 108 | Shader-Cluster (SMs) | 84 |
| 432 | Tensor-Kerne | 336 |
Kompatibilität und Abmessungen
| Dual-slot | Grafikkarten Bauform | Dual-slot |
| 267 mm 10.5 inches | Länge | 267 mm 10.5 inches |
| 250 W | Max. Stromverbrauch | 300 W |
| 600 W | Netzteil (Empfehlung) | 700 W |
| No outputs | Anschlüsse der Grafikkarte | 3x DisplayPort |
| 8-pin EPS | Zusätzlicher Stromanschluss | 8-pin EPS |
API-Unterstützung
| N/A | DirectX | 12 Ultimate (12_2) |
| N/A | OpenGL | 4.6 |
| 3.0 | OpenCL | 3.0 |
| N/A | Vulkan | 1.2 |
| N/A | Shader-Model | 6.6 |
| 8.0 | CUDA | 8.6 |