Notebookcheck Logo

NVIDIA GeForce RTX 4090 vs NVIDIA GeForce RTX 3070 Laptop GPU

NVIDIA GeForce RTX 4090

► remove from comparison NVIDIA NVIDIA GeForce RTX 4090

Die Nvidia GeForce RTX 4090 ist eine High-End-Desktop-Grafikkarte basierend auf die Ada Lovelace Architektur. Sie nutzt den großen AD102 Chip und bietet 16.384 der 18.432 Kerne und 24 GB GDDR6X Grafikspeicher (384 Bit Bus mit 21 Gbits).

Die Raytracing Performance ist dank 128 dedizierter Kerne sehr gut und die 512 Tensor Kerne können für DLSS 3 genutzt werden.

Die Gaming-Performance ist auch ohne DLSS ideal für 4k und erreicht in den meisten Spielen auch höhere Frameraten. Raytracing ist auch ohne DLSS gut nutzbar, jedoch oft bei reduzierter Auflösung. Im Konkurrenzvergleich ist die RTX 4090 Ende 2022 die schnellste Consumer-Grafikkarte und kann die (deutlich günstigere) AMD Radeon RX 7900 XTX hinter sich lassen.

Die aktuell verfügbaren Karten der RTX 4090 sind sehr groß (3 Slots) und nutzen den neuen 12VHPWR Anschluss (bei dem es bei Adaptern zu einigen Problemen kam).

Der AD102 Chip wird bei TSMC in 5nm (4N mit EUV) produziert und ist mit einem TGP (Total Graphics Power) von 450 Watt spezifiziert (Nvidia empfiehlt mind. ein 850 Watt Netzteil).

NVIDIA GeForce RTX 3070 Laptop GPU

► remove from comparison NVIDIA GeForce RTX 3070 Laptop GPU

Die Nvidia GeForce RTX 3070 Laptop GPU oder 3070 Mobile (für Laptops, GN20-E5, Max-P / Max-Q) ist Anfang 2021 die zweit-schnellste Grafikkarte für Notebooks. Sie basiert auf den GA104-770-A1 Ampere Chip und bietet 8 GB GDDR6 Grafikspeicher mit einem 256 Bit Grafikbus (mit 12 oder 14 Gbps). Sie unterstützt PCIe 4.0 und soll in zwei verschiedenen Varianten mit 80, 90, 115 bzw. 125 Watt (TGP) verfügbar sein. Als Package nutzt die Notebook-Grafikkarte GB5-256 und die Chipgröße soll 40x40mm betragen. Die GPU unterstützt eDP 1.4b zum Anschluss des internen Monitors.

Es gibt nun keine Max-Q Variante mehr (die 80 - 90 Watt Versionen heissen auch nur "Laptop GPU"), aber jede TGP-Version kann die Max-Q Technologien nutzen (Dynamic Boost, Whispermode).

Die Leistung ist abhängig von der TGP-Variante und der verwendeten Kühlung. Im Schnitt sollte sie etwa auf dem Level einer alten RTX 2080 Super Mobile liegen. Dadurch reicht die Leistung bei den meisten anspruchsvollen Spielen auch für 4k mit maximalen Details. Bei 1080p sind auch Frameraten über 100 fps möglich.

Der GA104 Chip bietet 6144 FP32 ALUs wovon die Hälfte auch INT32 Befehle ausführen können (also 3072 INT32 ALUs). Bei Turing konnten noch alle Shader FP32 oder INT32 ausführen. Die Raytracing und Tensor Kerne auf dem Chip wurden laut Nvidia ebenfalls verbessert. Die RTX 3070 nutzt 5120 der 6144 Kerne. Weiters integriert der Ampere Chip einen Hardware Video-Encoder (NVENC 5. Generation für H.264 und H.265) und Decoder (7. Generation für zahlreiche Formate inklusive AV1).

Der GA104 Chip wird bei Samsung im 8nm (8N) Verfahren welches mit dem 7nm Verfahren von TSMC nicht ganz mithalten kann (z.B. von AMD genutzt, aber auch für den professionellen GA100 Ampere Chip).

NVIDIA GeForce RTX 4090NVIDIA GeForce RTX 3070 Laptop GPU
GeForce RTX 3000 Serie
NVIDIA GeForce RTX 4090 16384 @ 2.24 - 2.52 GHz384 Bit @ 21000 MHz
NVIDIA GeForce RTX 4080 Super compare 10240 @ 2.3 - 2.55 GHz256 Bit @ 23000 MHz
NVIDIA GeForce RTX 4080 compare 9728 @ 2.21 - 2.51 GHz256 Bit @ 22400 MHz
NVIDIA GeForce RTX 4070 Ti SUPER compare 8448 @ 2.34 - 2.61 GHz256 Bit @ 21000 MHz
NVIDIA GeForce RTX 4070 Ti compare 7680 @ 2.31 - 2.61 GHz192 Bit @ 21000 MHz
NVIDIA GeForce RTX 4070 SUPER compare 7168 @ 1.98 - 2.48 GHz192 Bit @ 21000 MHz
NVIDIA GeForce RTX 4070 compare 5888 @ 1.92 - 2.48 GHz192 Bit @ 21000 MHz
NVIDIA GeForce RTX 4060 Ti 16G compare 4352 @ 2.31 - 2.54 GHz128 Bit @ 18000 MHz
NVIDIA GeForce RTX 4060 Ti 8G compare 4352 @ 2.31 - 2.54 GHz128 Bit @ 18000 MHz
NVIDIA GeForce RTX 4060 compare 3072 @ 1.83 - 2.46 GHz128 Bit @ 17000 MHz
NVIDIA GeForce RTX 3090 Ti compare 10752 @ 1.56 - 1.86 GHz384 Bit @ 21000 MHz
NVIDIA GeForce RTX 3090 compare 10496 @ 1.4 - 1.7 GHz384 Bit @ 19500 MHz
NVIDIA GeForce RTX 3080 Ti compare 10240 @ 1.37 - 1.67 GHz384 Bit @ 19000 MHz
NVIDIA GeForce RTX 3080 12 GB compare 8960/ cores @ 1.26 - 1.71 GHz384 Bit @ 19000 MHz
NVIDIA GeForce RTX 3080 compare 8704 @ 1.45 - 1.71 GHz320 Bit @ 19000 MHz
GeForce RTX 3070 Ti compare 6144 @ 1.58 - 1.77 GHz256 Bit @ 19000 MHz
GeForce RTX 3080 Ti Laptop GPU compare 7424 @ 0.98 - 1.59 GHz256 Bit @ 14000 MHz
NVIDIA GeForce RTX 3070 compare 5888 @ 1.5 - 1.73 GHz256 Bit @ 14000 MHz
GeForce RTX 3080 Laptop GPU compare 6144 @ 0.78 - 1.25 GHz256 Bit @ 14000 MHz
NVIDIA GeForce RTX 3060 Ti compare 4864 @ 1.41 - 1.67 GHz256 Bit @ 14000 MHz
GeForce RTX 3070 Ti Laptop GPU compare 5888 @ 0.92 - 1.48 GHz256 Bit @ 14000 MHz
GeForce RTX 3070 Laptop GPU 5120 @ 0.78 - 1.29 GHz256 Bit @ 14000 MHz
NVIDIA GeForce RTX 3060 compare 3584 @ 1.32 - 1.78 GHz192 Bit @ 15000 MHz
GeForce RTX 3080 Max-Q compare 6144 @ 0.78 - 1.25 GHz256 Bit @ 6000 MHz
GeForce RTX 3070 Max-Q compare 5120 @ 1.29 GHz256 Bit
GeForce RTX 3060 Laptop GPU compare 3840 @ 0.82 - 1.7 GHz192 Bit @ 14000 MHz
GeForce RTX 3060 Max-Q compare 3840 @ 1.28 GHz192 Bit
NVIDIA GeForce RTX 3050 compare 2560 @ 1.55 - 1.78 GHz128 Bit Bit @ 1750 MHz
GeForce RTX 3050 Ti Laptop GPU compare 2560 @ 1.22 - 1.49 GHz128 Bit @ 12000 MHz
GeForce RTX 3050 6GB Laptop GPU compare 2560 @ 1.24 - 1.49 GHz96 Bit @ 12000 MHz
GeForce RTX 3050 A Laptop GPU compare 1792 64 Bit
GeForce RTX 3050 4GB Laptop GPU compare 2048 @ 1.24 - 1.5 GHz128 Bit @ 12000 MHz
CodenameAD102-300-A1GN20-E5 GA104
ArchitekturAda LovelaceAmpere
Pipelines16384 - unified5120 - unified
TMUs512160
ROPs17696
Raytracing Cores12840
Tensor / AI Cores512160
Kerntakt2235 - 2520 (Boost) MHz780 - 1100 - 1290 - 1620 (Boost) MHz
Theoretical Performance82.6 TFLOPS FP16, 82.6 TFLOPS FP32
CacheL2: 72 MB
Speichertakt21000 effective = 1313 MHz14000 effective = 1750 MHz
Speicherbandbreite384 Bit256 Bit
SpeichertypGDDR6XGDDR6
Max. Speichergröße24 GB8 GB
Shared Memoryneinnein
Memory Bandwidth1008 GB/s448 GB/s
APIDirectX 12 Ultimate, Shader 6.7, OpenGL 4.6, OpenCL 3.0, Vulkan 1.3DirectX 12_2, Shader 6.7, OpenGL 4.6
Stromverbrauch450 Watt125 Watt (80 - 125 Watt TGP)
Transistors76.3 Billion
Die Size 608 mm²
Herstellungsprozess5 nm8 nm
Displays4 Displays (max.), HDMI 2.1, DisplayPort 1.4aHDMI 2.1, DisplayPort 1.4a
Erscheinungsdatum20.09.2022 04.01.2021
Herstellerseitewww.nvidia.com
PredecessorNVIDIA GeForce RTX 3090
PCIe4.0
FeaturesNVIDIA DLSS, NVIDIA Reflex, Resizable BAR, NVIDIA Broadcast, NVIDIA Ansel, NVIDIA ShadowPlay®, NVIDIA G-SYNC®, Advanced Optimus, Nvidia Max-Q, Dynamic Boost
Notebookgrößegroß (17" z.B.)

Benchmarks

Performance Rating - 3DMark 11 + Fire Strike + Time Spy - NVIDIA GeForce RTX 4090
33.3 pt (100%)
Performance Rating - 3DMark 11 + Fire Strike + Time Spy - GeForce RTX 3070 Laptop GPU
11.3 pt (34%)
3DMark - 3DMark Time Spy Score
min: 24181     avg: 30258     median: 30712 (89%)     max: 34682 Points
min: 2952     avg: 9246     median: 9681 (28%)     max: 10872 Points
3DMark - 3DMark Time Spy Graphics
min: 32488     avg: 36259     median: 36739 (97%)     max: 37809 Points
min: 2644     avg: 9300     median: 9619 (25%)     max: 11019 Points
3DMark - 3DMark Ice Storm Unlimited Graphics
min: 650505     avg: 788285     median: 790660 (80%)     max: 990769 Points
min: 386399     avg: 506983     median: 510435 (52%)     max: 586342 Points
3DMark - 3DMark Ice Storm Extreme Graphics
min: 468296     avg: 674939     median: 676783 (79%)     max: 853906 Points
min: 199308     avg: 361585     median: 399566 (47%)     max: 447899 Points
3DMark - 3DMark Cloud Gate Score
min: 57157     avg: 84459     median: 85474 (81%)     max: 105843 Points
min: 29530     avg: 48192     median: 49493 (47%)     max: 59798 Points
3DMark - 3DMark Cloud Gate Graphics
min: 176585     avg: 271586     median: 260357 (64%)     max: 406437 Points
min: 45531     avg: 121367     median: 136558 (34%)     max: 179716 Points
3DMark - 3DMark Fire Strike Standard Score
min: 39525     avg: 51117     median: 52514 (88%)     max: 59532 Points
min: 6019     avg: 20668     median: 21167 (36%)     max: 24431 Points
3DMark - 3DMark Fire Strike Standard Graphics
min: 55924     avg: 74480     median: 75470 (85%)     max: 88564 Points
min: 7178     avg: 24302     median: 25477.5 (29%)     max: 29128 Points
3DMark - 3DMark Ice Storm Graphics
min: 513138     avg: 713798     median: 711423 (79%)     max: 903610 Points
min: 200537     avg: 393010     median: 434822 (48%)     max: 501858 Points
3DMark - 3DMark Wild Life Unlimited
198505 Points (100%)
min: 55454     avg: 61652     median: 62900 (32%)     max: 67085 Points
3DMark - 3DMark Wild Life Extreme Unlimited
86227 Points (100%)
min: 17126     avg: 19749     median: 20212 (23%)     max: 21693 Points
3DMark - 3DMark Night Raid
min: 51233     avg: 86040     median: 87344 (82%)     max: 105987 Points
min: 43141     avg: 49981     median: 51466.5 (49%)     max: 53851 Points
3DMark - 3DMark Night Raid Graphics Score
min: 120914     avg: 208971     median: 209923 (81%)     max: 259910 Points
min: 76506     avg: 91144     median: 89814.5 (35%)     max: 108442 Points
3DMark 11 - 3DM11 Performance Score
min: 48408     avg: 63075     median: 62884 (81%)     max: 77609 Points
min: 8279     avg: 25052     median: 26152 (34%)     max: 30240 Points
3DMark 11 - 3DM11 Performance GPU
min: 85108     avg: 104201     median: 104522 (90%)     max: 116361 Points
min: 12535     avg: 32331     median: 33996 (29%)     max: 38275 Points