Notebookcheck Logo

NVIDIA RTX A3000 Laptop GPU vs NVIDIA GeForce RTX 4090 vs NVIDIA GeForce RTX 4060 Ti 16G

NVIDIA RTX A3000 Laptop GPU

► remove from comparison NVIDIA RTX A3000 Laptop GPU

Die Nvidia RTX A3000 Laptop GPU oder A3000 Mobile (für Laptops) ist eine professionelle Grafikkarte für mobile Workstations. Sie bietet eine ähnliche Performance wie die Consumer GeForce RTX 3060 Laptop GPU und bietet mit 4096 genau 256 CUDA-Kerne mehr (und basiert daher auf den größeren GA104 Chip). Weiters integriert die A3000 32 RT-Kerne und 128 Tensor-Kerne. Im Vergleich zu einer günstigeren GeForce RTX 3070 Laptop GPU mit Studio Treibern, bietet die RTX A3000 zertifizierte Treiber für zahlreiche professionelle Applikationen und wahrscheinlich eine minimal höhere Performance.

In 2022 veröffentlichte Nvidia eine leicht verbesserte Version der RTX A3000 mit mehr und schneller getaktetem Grafikspeicher. Die ursprünglichen 6 GB mit 11 GBits wurden verdoppelt zu 12 GB GDDR6 die mit 14 GBits getaktet werden.

Wie auch die GeForce RTX 3060 Mobile, ist auch die RTX A3000 in verschiedenen TGP-Versionen erhältlich. Diese rangieren bei der A3000 von 60 - 130 Watt und damit im Maximum 15W höher als die RTX 3060 Mobile. Je nach verbauter Variante unterscheiden sich die Taktraten von Chip und Speicher und damit auch deutlich die Performance.

Es gibt nun keine Max-Q Variante mehr (die 60 - 90 Watt Versionen heissen auch nur "Laptop GPU"), aber jede TGP-Version kann die Max-Q Technologien nutzen (Dynamic Boost, WhisperMode).

Die professionellen Grafikkarten von Nvidia bieten zertifizierte Treiber, welche auf Stabiltität und Performance bei professionellen Anwendungen (CAD-, DCC-, Medizin-, Prospektions-, Visualisierungsanwendungen) optimiert sind.

Die Leistung ist abhängig von der TGP-Variante und der verwendeten Kühlung. Bei gleichem TGP sollte sie aber deutlich oberhalb einer alten Quadro RTX 3000 bzw. RTX 3000 Max-Q für Laptops liegen. 

Der GA104 Chip bietet 6.144 FP32 ALUs wovon die Hälfte auch INT32 Befehle ausführen können (also 3.072 INT32 ALUs). Bei Turing konnten noch alle Shader FP32 oder INT32 ausführen. Die Raytracing und Tensor Kerne auf dem Chip wurden laut Nvidia ebenfalls verbessert. Die RTX A4000 nutzt jedoch nur 4.096 der 6.144 Kerne.

Der GA104 Chip wird bei Samsung im 8nm (8N) Verfahren welches mit dem 7nm Verfahren von TSMC nicht ganz mithalten kann (z.B. von AMD genutzt, aber auch für den professionellen GA100 Ampere Chip).

NVIDIA GeForce RTX 4090

► remove from comparison NVIDIA NVIDIA GeForce RTX 4090

Die Nvidia GeForce RTX 4090 ist eine High-End-Desktop-Grafikkarte basierend auf die Ada Lovelace Architektur. Sie nutzt den großen AD102 Chip und bietet 16.384 der 18.432 Kerne und 24 GB GDDR6X Grafikspeicher (384 Bit Bus mit 21 Gbits).

Die Raytracing Performance ist dank 128 dedizierter Kerne sehr gut und die 512 Tensor Kerne können für DLSS 3 genutzt werden.

Die Gaming-Performance ist auch ohne DLSS ideal für 4k und erreicht in den meisten Spielen auch höhere Frameraten. Raytracing ist auch ohne DLSS gut nutzbar, jedoch oft bei reduzierter Auflösung. Im Konkurrenzvergleich ist die RTX 4090 Ende 2022 die schnellste Consumer-Grafikkarte und kann die (deutlich günstigere) AMD Radeon RX 7900 XTX hinter sich lassen.

Die aktuell verfügbaren Karten der RTX 4090 sind sehr groß (3 Slots) und nutzen den neuen 12VHPWR Anschluss (bei dem es bei Adaptern zu einigen Problemen kam).

Der AD102 Chip wird bei TSMC in 5nm (4N mit EUV) produziert und ist mit einem TGP (Total Graphics Power) von 450 Watt spezifiziert (Nvidia empfiehlt mind. ein 850 Watt Netzteil).

NVIDIA GeForce RTX 4060 Ti 16G

► remove from comparison NVIDIA NVIDIA GeForce RTX 4060 Ti 16G

Die Nvidia GeForce RTX 4060 Ti 16 GB ist eine Mid-Range-Desktop-GPU und wird im 5 nm Verfahren bei TSMC gefertigt. Neben dem 8-GB-Modell gibt es nun auch ein 16-GB-Modell, welches vordergründig bei leistungshungrigen Spielen einen spürbaren Mehrwert bieten soll.  Mit den beiden GeForce RTX 4060 Modellen rundet Nvidia sein aktuelles Line-up der Ada-Lovelace weiter in Richtung Mittelklasse ab. Als Chip kommt hier der AD106 zum Einsatz. Dieser vereint 4.352 Schadereinheiten und 16-GB-GDDR6 stehen hier zur Verfügung. Das Speicherinterface beträgt 128 Bit, woraus eine Speicherbandbreite von 288 GB/s resultiert.

Features

Die bereits mit den High-End-Modellen der Ada-Lovelace-Generation Einzug gehaltenen Features, wie DLSS 3.0 mit Framegeneration, wird der Nvidia GeForce RTX 4060 Ti 16 GB nicht vorenthalten. Damit hebt sich die neue Mittelklasse von der Nvidia GeForce RTX 3060 Ti deutlich ab und kann in Spielen, welche diese Features bieten, einen deutlichen Vorteil erlangen. 

Performance

Ohne DLSS ist die Leistung reine Rasterleistung mit einer Nvidia GeForce RTX 4060 Ti 8 GB vergleichbar. Gegenüber einer Nvidia GeForce RTX 3060 Ti kann die Nvidia GeForce RTX 4060 Ti 16 GB etwa 10 Prozent mehr Leistung erbringen. Gegenüber AMD positioniert sich die Nvidia GeForce RTX 4060 Ti 16 GB mit einem kleinen Vorsprung vor der Radeon RX 7600. Die 16-GB-VRAM machen sich in einigen Spielen aber positiv bemerkbar. Mitunter sehen wir deutlich besserer Frameraten bei den Spielen, wo es mit 8-GB-VRAM eng wird. Das anvisierte Ziel einer guten Gaming-GPU für den1.080p-Gaming-Bereich ist Nvidia geglückt und mit dem 16-GB-VRAM ist die Nvidia GeForce RTX 4060 Ti das interessantere Modell der beiden RTX 4060 Ti Modelle. Leider verlangt Nvidia einen saftigen Aufpreis für den größeren VRAM. Damit hat es die Nvidia GeForce RTX 4060 Ti 16 GB nicht unbedingt leichter sich im Markt zu positionieren.

Leistungsaufnahme

Die Leistungsaufnahme der Nvidia GeForce RTX 4060 Ti 16 GB wird vom Hersteller mit 165 Watt (TDP) angegeben. Das sind 5 Watt mehr als beim 8-GB-Modell. Um den Grafikchip nicht mit weniger Energie versorgen zu müssen, war eine Erhöhung der Leistungsaufnahme unumgänglich. Gegenüber der Nvidia GeForce RTX 3060 Ti ist die Nvidia GeForce RTX 4060 Ti 16 GB allerdings weiterhin deutlich sparsamer.

NVIDIA RTX A3000 Laptop GPUNVIDIA GeForce RTX 4090NVIDIA GeForce RTX 4060 Ti 16G
GeForce RTX 4000 Serie
RTX A5500 Laptop GPU 7424 256 Bit @ 16000 MHz
RTX A4500 Laptop GPU 5888 @ 0.93 - 1.5 GHz256 Bit @ 16000 MHz
RTX A5000 Laptop GPU 6144 @ 1.22 - 1.77 GHz256 Bit @ 14000 MHz
RTX A4000 Laptop GPU 5120 @ 0.78 - 1.68 GHz256 Bit @ 12000 MHz
RTX A3000 Laptop GPU 4096 @ 1.08 - 1.56 GHz192 Bit @ 14000 MHz
RTX A2000 3328 @ 0.56 - 1.2 GHz192 Bit @ 12000 MHz
RTX A2000 Laptop GPU 2560 @ 0.89 - 1.69 GHz128 Bit @ 14000 MHz
RTX A1000 Laptop GPU 2048 128 Bit @ 14000 MHz
RTX A500 Laptop GPU 2048 64 Bit @ 14000 MHz
NVIDIA GeForce RTX 4090 16384 @ 2.24 - 2.52 GHz384 Bit @ 21000 MHz
NVIDIA GeForce RTX 4080 Super 10240 @ 2.3 - 2.55 GHz? Bit @ 23000 MHz
NVIDIA GeForce RTX 4080 9728 @ 2.21 - 2.51 GHz256 Bit @ 22400 MHz
NVIDIA GeForce RTX 4070 Ti SUPER 8448 @ 2.34 - 2.61 GHz256 Bit @ 21000 MHz
NVIDIA GeForce RTX 4070 Ti 7680 @ 2.31 - 2.61 GHz192 Bit @ 21000 MHz
NVIDIA GeForce RTX 4070 SUPER 7168 @ 1.98 - 2.48 GHz192 Bit @ 21000 MHz
NVIDIA GeForce RTX 4070 5888 @ 1.92 - 2.48 GHz192 Bit @ 21000 MHz
NVIDIA GeForce RTX 4060 Ti 16G 4352 @ 2.31 - 2.54 GHz128 Bit @ 18000 MHz
NVIDIA GeForce RTX 4060 Ti 8G 4352 @ 2.31 - 2.54 GHz128 Bit @ 18000 MHz
NVIDIA GeForce RTX 4060 3072 @ 1.83 - 2.46 GHz128 Bit @ 17000 MHz
NVIDIA GeForce RTX 4090 16384 @ 2.24 - 2.52 GHz384 Bit @ 21000 MHz
NVIDIA GeForce RTX 4080 Super 10240 @ 2.3 - 2.55 GHz? Bit @ 23000 MHz
NVIDIA GeForce RTX 4080 9728 @ 2.21 - 2.51 GHz256 Bit @ 22400 MHz
NVIDIA GeForce RTX 4070 Ti SUPER 8448 @ 2.34 - 2.61 GHz256 Bit @ 21000 MHz
NVIDIA GeForce RTX 4070 Ti 7680 @ 2.31 - 2.61 GHz192 Bit @ 21000 MHz
NVIDIA GeForce RTX 4070 SUPER 7168 @ 1.98 - 2.48 GHz192 Bit @ 21000 MHz
NVIDIA GeForce RTX 4070 5888 @ 1.92 - 2.48 GHz192 Bit @ 21000 MHz
NVIDIA GeForce RTX 4060 Ti 16G 4352 @ 2.31 - 2.54 GHz128 Bit @ 18000 MHz
NVIDIA GeForce RTX 4060 Ti 8G 4352 @ 2.31 - 2.54 GHz128 Bit @ 18000 MHz
NVIDIA GeForce RTX 4060 3072 @ 1.83 - 2.46 GHz128 Bit @ 17000 MHz
CodenameGA104AD102-300-A1AD106
ArchitekturAmpereAda LovelaceAda Lovelace
Pipelines4096 - unified16384 - unified4352 - unified
TMUs128512136
ROPs6417648
Raytracing Cores3212834
Tensor / AI Cores128512136
Kerntakt1080 - 1560 (Boost) MHz2235 - 2520 (Boost) MHz2310 - 2535 (Boost) MHz
Speichertakt14000 effective = 1750 MHz21000 effective = 1313 MHz18000 effective = 2250 MHz
Speicherbandbreite192 Bit384 Bit128 Bit
SpeichertypGDDR6GDDR6XGDDR6
Max. Speichergröße12 GB24 GB16 GB
Shared Memoryneinneinnein
Memory Bandwidth264 GB/s1008 GB/s288 GB/s
APIDirectX 12_2, Shader 6.7, OpenGL 4.6DirectX 12 Ultimate, Shader 6.7, OpenGL 4.6, OpenCL 3.0, Vulkan 1.3DirectX 12_2, Shader 6.7, OpenGL 4.6, OpenCL 3.0, Vulkan 1.3
Stromverbrauch130 Watt (60 - 115 Watt TGP)450 Watt
Transistors17.4 Billion76.3 Billion
Die Size 392 mm² 608 mm² 188 mm²
Herstellungsprozess8 nm5 nm5 nm
PCIe4.0PCIe 4.0 x8
DisplaysHDMI 2.1, DisplayPort 1.44 Displays (max.), HDMI 2.1, DisplayPort 1.4a4 Displays (max.), HDMI 2.1, DisplayPort 1.4a
FeaturesDisplayPort 1.4, HDMI 2.1, PCIe 4.0 x16, 12.8 SP-FP TFLOPS Peak, 102 Tensor Performance Peak, up to 264 GB/s Memory Bandwidth, Resizable BAR, Support for Modern StandbyDLSS 3.0, Frame-Generation, Ray-Tracing
Notebookgrößegroß (17" z.B.)
Erscheinungsdatum12.04.2021 20.09.2022 18.05.2023
Herstellerseitewww.nvidia.comwww.nvidia.com
Theoretical Performance82.6 TFLOPS FP16, 82.6 TFLOPS FP3222.06 TFLOPS FP16, 22.06 TFLOPS FP32, 0.3448 TFLOPS FP64
CacheL2: 72 MBL2: 32.768 KB
PredecessorNVIDIA GeForce RTX 3090NVIDIA GeForce RTX 3060 Ti

Benchmarks

Performance Rating - 3DMark 11 + Fire Strike + Time Spy - NVIDIA GeForce RTX 4090
33.3 pt (100%)
Performance Rating - 3DMark 11 + Fire Strike + Time Spy - NVIDIA GeForce RTX 4060 Ti 16G
14.6 pt (44%)
3DMark - 3DMark Time Spy Score
min: 6490     avg: 7324     median: 7703 (22%)     max: 7779 Points
min: 24181     avg: 30333     median: 30977 (89%)     max: 34682 Points
13605 Points (39%)
3DMark - 3DMark Time Spy Graphics
min: 6530     avg: 7129     median: 7320 (19%)     max: 7536 Points
min: 32488     avg: 36344     median: 36836 (97%)     max: 37809 Points
13359 Points (35%)
3DMark - 3DMark Ice Storm Unlimited Graphics
min: 650505     avg: 779210     median: 771257 (78%)     max: 990769 Points
600933 Points (61%)
3DMark - 3DMark Ice Storm Extreme Graphics
min: 468296     avg: 662755     median: 676124 (84%)     max: 804971 Points
441972 Points (55%)
3DMark - 3DMark Cloud Gate Score
24449 Points (26%)
min: 57157     avg: 83722     median: 85501 (91%)     max: 93547 Points
75160 Points (80%)
3DMark - 3DMark Cloud Gate Graphics
29996 Points (8%)
min: 182384     avg: 266905     median: 260357 (68%)     max: 380191 Points
165263 Points (43%)
3DMark - 3DMark Fire Strike Standard Score
min: 15711     avg: 17366     median: 18097 (32%)     max: 18291 Points
min: 39525     avg: 51149     median: 53417 (94%)     max: 56677 Points
31146 Points (55%)
3DMark - 3DMark Fire Strike Standard Graphics
min: 17034     avg: 19054     median: 19710 (22%)     max: 20417 Points
min: 62091     avg: 75079     median: 73447 (83%)     max: 88564 Points
32275 Points (36%)
3DMark - 3DMark Ice Storm Graphics
min: 513138     avg: 701320     median: 703634 (82%)     max: 856491 Points
507049 Points (59%)
3DMark - 3DMark Wild Life Unlimited
198505 Points (100%)
3DMark - 3DMark Wild Life Extreme Unlimited
14526 Points (17%)
86227 Points (100%)
3DMark - 3DMark Night Raid
min: 51233     avg: 84543     median: 86194 (81%)     max: 105987 Points
78458 Points (74%)
3DMark - 3DMark Night Raid Graphics Score
min: 120914     avg: 205437     median: 209337 (81%)     max: 259910 Points
158525 Points (61%)
3DMark 11 - 3DM11 Performance Score
min: 20760     avg: 23171     median: 23888 (33%)     max: 24865 Points
min: 48408     avg: 62823     median: 63861 (88%)     max: 72163 Points
38780 Points (54%)
3DMark 11 - 3DM11 Performance GPU
min: 23699     avg: 25737     median: 25990 (22%)     max: 27523 Points
min: 99614     avg: 105410     median: 104598 (90%)     max: 116361 Points
43112 Points (37%)
3DMark Vantage
3DM Vant. Perf. total + NVIDIA RTX A3000 Laptop GPU
3DMark Vantage - 3DM Vant. Perf. total
71308 Points (21%)
3DM Vant. Perf. total + NVIDIA GeForce RTX 4090
min: 98691     avg: 134061     median: 137609 (40%)     max: 149121 Points
3DM Vant. Perf. total + NVIDIA GeForce RTX 4060 Ti 16G
116054 Points (34%)
3DM Vant. Perf. GPU no PhysX + NVIDIA RTX A3000 Laptop GPU
3DMark Vantage - 3DM Vant. Perf. GPU no PhysX
76250 Points (42%)
3DM Vant. Perf. GPU no PhysX + NVIDIA GeForce RTX 4090
min: 121158     avg: 160170     median: 163309 (89%)     max: 183305 Points
3DM Vant. Perf. GPU no PhysX + NVIDIA GeForce RTX 4060 Ti 16G
119922 Points (65%)
3DMark 05 - 3DMark 05 - Standard
min: 42502     avg: 76282     median: 79169.5 (87%)     max: 90985 Points
85110 Points (93%)
3DMark 06 3DMark 06 - Standard 1280x1024 + NVIDIA GeForce RTX 4090
3DMark 06
min: 48428     avg: 63560     median: 64352.5 (84%)     max: 72466 Points
3DMark 06 - Standard 1280x1024 + NVIDIA GeForce RTX 4060 Ti 16G
66993 Points (88%)
Unigine Valley 1.0 - Unigine Valley 1.0 DX
min: 213.1     avg: 271.2     median: 273.9 (85%)     max: 324 fps
127.8 fps (39%)
Blender - Blender 3.3 Classroom CUDA *
60 Seconds (9%)
min: 10     avg: 15.5     median: 10 (1%)     max: 103 Seconds
Blender - Blender 3.3 Classroom OPTIX *
34 Seconds (13%)
min: 7     avg: 7.7     median: 8 (3%)     max: 9 Seconds
18 Seconds (7%)
SPECviewperf 12
specvp12 sw-03 + NVIDIA GeForce RTX 4090
SPECviewperf 12 - specvp12 sw-03
min: 105     avg: 125.1     median: 127 (32%)     max: 139 fps
specvp12 sw-03 + NVIDIA GeForce RTX 4060 Ti 16G
95.1 fps (24%)
specvp12 snx-02 + NVIDIA GeForce RTX 4090
SPECviewperf 12 - specvp12 snx-02
min: 25.3     avg: 28     median: 28 (4%)     max: 31.4 fps
specvp12 snx-02 + NVIDIA GeForce RTX 4060 Ti 16G
14.8 fps (2%)
specvp12 showcase-01 + NVIDIA GeForce RTX 4090
SPECviewperf 12 - specvp12 showcase-01
min: 397     avg: 431.5     median: 434 (95%)     max: 459 fps
specvp12 showcase-01 + NVIDIA GeForce RTX 4060 Ti 16G
132 fps (29%)
specvp12 mediacal-01 + NVIDIA GeForce RTX 4090
SPECviewperf 12 - specvp12 mediacal-01
min: 118     avg: 237.7     median: 262 (67%)     max: 312 fps
specvp12 mediacal-01 + NVIDIA GeForce RTX 4060 Ti 16G
110 fps (28%)
specvp12 maya-04 + NVIDIA GeForce RTX 4090
SPECviewperf 12 - specvp12 maya-04
min: 239     avg: 302.7     median: 306 (83%)     max: 340 fps
specvp12 maya-04 + NVIDIA GeForce RTX 4060 Ti 16G
257 fps (70%)
specvp12 energy-01 + NVIDIA GeForce RTX 4090
SPECviewperf 12 - specvp12 energy-01
min: 54.2     avg: 78.1     median: 83.3 (74%)     max: 84.7 fps
specvp12 energy-01 + NVIDIA GeForce RTX 4060 Ti 16G
22.6 fps (20%)
specvp12 creo-01 + NVIDIA GeForce RTX 4090
SPECviewperf 12 - specvp12 creo-01
min: 103     avg: 117.5     median: 118 (47%)     max: 127 fps
specvp12 creo-01 + NVIDIA GeForce RTX 4060 Ti 16G
73.4 fps (29%)
specvp12 catia-04 + NVIDIA GeForce RTX 4090
SPECviewperf 12 - specvp12 catia-04
min: 244     avg: 266.3     median: 263 (43%)     max: 293 fps
specvp12 catia-04 + NVIDIA GeForce RTX 4060 Ti 16G
128 fps (21%)
specvp12 3dsmax-05 + NVIDIA GeForce RTX 4090
SPECviewperf 12 - specvp12 3dsmax-05
min: 473     avg: 539     median: 545 (95%)     max: 571 fps
specvp12 3dsmax-05 + NVIDIA GeForce RTX 4060 Ti 16G
290 fps (51%)
SPECviewperf 13 specvp13 sw-04 + NVIDIA RTX A3000 Laptop GPU
SPECviewperf 13 - specvp13 sw-04
min: 149.8     avg: 152.7     median: 151.6 (41%)     max: 156.7 fps
specvp13 sw-04 + NVIDIA GeForce RTX 4090
min: 164     avg: 183.8     median: 186 (50%)     max: 200 fps
specvp13 sw-04 + NVIDIA GeForce RTX 4060 Ti 16G
135 fps (36%)
specvp13 snx-03 + NVIDIA RTX A3000 Laptop GPU
SPECviewperf 13 - specvp13 snx-03
min: 232.9     avg: 254.1     median: 250.2 (28%)     max: 279.21 fps
specvp13 snx-03 + NVIDIA GeForce RTX 4090
min: 45.7     avg: 50.7     median: 50.5 (6%)     max: 56.3 fps