Nvidia GeForce RTX 4090 Founders Edition im Test: Unübertroffener 4K-100-fps-Gigant für $400 weniger als eine RTX 3090 Ti
Als Ende 2020 die ersten Gerüchte über eine neue Nvidia-GPU auf Basis der Ada-Lovelace-Architektur aufkamen, lasen sich die angeblichen Specs geradezu erstaunlich. Nun ist die RTX 4090 endlich auch verfügbar (für 1.949 Euro) und wirkt so beeindruckend, wie eine Consumer-GPU nur sein kann.
Die RTX 4090 AD102 beherbergt ganze 16.384 CUDA Cores, 512 Gen4 Tensor Cores und 128 Gen3 RT Cores. Damit beschneidet man den kompletten AD102-Chip also ein wenig, dieser beinhaltet theoretisch 18.432 CUDA Cores, 568 Tensor Cores und 142 RT Cores. Das macht aber auch klar, dass wir in Zukunft wohl noch eine "RTX 4090 Ti" zu Gesicht bekommen werden.
Ein Ada Graphics Processing Cluster (GPC) beinhaltet eine Raster-Engine, sechs Texture Processor Clusters (TPCs), 12 Streaming Multiprocessors (SMs) und 16 Raster Operations Pipelines (ROPs).
Jeder SM besteht wiederum aus 128 CUDA Cores, einem RT Core, vier Tensor Cores, vier Texture Units, einem 256-KB-Register sowie 128 KB konfigurierbarem L1 Cache.
In diesem Test schauen wir uns das Ada-Flaggschiff, die Nvidia GeForce RTX 4090 Founders Edition, an und überprüfen den Gen-zu-Gen-Leistungsgewinn und den damit erreichten Fortschritt, den die neue Architektur gegenüber Ampere- sowie AMD-RDNA-2-Flaggschiffmodellen bringt.
Vergleich der RTX 4090 mit anderen Nvidia-GPUs
Specifikation | RTX 4090 FE | RTX 3090 Ti FE | RTX 3090 FE | RTX 3080 Ti FE | RTX 3080 FE | RTX 3070 FE | RTX 3060 Ti FE | Titan RTX | Titan X Pascal |
Chip | AD102 | GA102 | GA102 | GA102 | GA102 | GA104 | GA104 | TU102 | GP102 |
FinFET Process | Custom 4N | 8 nm | 8 nm | 8 nm | 8 nm | 8 nm | 8 nm | 12 nm | 16 nm |
CUDA Cores | 16,384 | 10,752 | 10,496 | 10,240 | 8,704 | 5,888 | 4,864 | 4,608 | 3,584 |
Texture Units | 512 | 336 | 328 | 320 | 272 | 184 | 152 | 288 | 224 |
Tensor Cores | 512 4th Gen. | 336 3rd Gen. | 328 3rd Gen. | 320 3rd Gen. | 272 3rd Gen. | 184 3rd Gen. | 152 3rd Gen. | 576 2nd Gen. | — |
RT Cores | 128 3rd Gen. | 84 2nd Gen. | 82 2nd Gen. | 80 2nd Gen. | 68 2nd Gen. | 46 2nd Gen. | 38 2nd Gen. | 72 | — |
GPU Basis Takt | 2,235 MHz | 1,560 MHz | 1,395 MHz | 1,365 MHz | 1,440 MHz | 1,500 MHz | 1,410 MHz | 1,350 MHz | 1,417 MHz |
GPU Boost Takt | 2,520 MHz | 1,860 MHz | 1,695 MHz | 1,665 MHz | 1,710 MHz | 1,750 MHz | 1,665 MHz | 1,770 MHz | 1,531 MHz |
Speicherbus | 384-bit | 384-bit | 384-bit | 384-bit | 320-bit | 256-bit | 256-bit | 384-bit | 384-bit |
Speicherbandbreite | 1,008 GB/s | 1,008 GB/s | 936 GB/s | 912 GB/s | 760 GB/s | 448 GB/s | 448 GB/s | 672 GB/s | 480.4 GB/s |
Videospeicher | 24 GB GDDR6X | 24 GB GDDR6X | 24 GB GDDR6X | 12 GB GDDR6X | 10 GB GDDR6X | 8 GB GDDR6 | 8 GB GDDR6 | 24 GB GDDR6 | 12 GB GDDR5X |
Verbrauch | 450 W | 450 W | 350 W | 350 W | 320 W | 220 W | 200 W | 280 W | 250 W |
Die Nvidia GeForce RTX 4090 Founders Edition näher betrachtet
Auch wenn der Chip nicht ganz komplett ausgenutzt wird, so stecken in dem aktuellen AD102-Die der RTX 4090 ganze 76,3 Milliarden Transistoren — beinahe 170 Prozent mehr verglichen mit der RTX 3090 Ti — während gleichzeitig die Die-Größe um 3 Prozent auf 608,5 mm2 geschrumpft ist. AD102 basiert dabei auf TSMCs N5-Prozess, allerdings bezeichnet Nvidia das durch die eigenen Anpassungen als "4N".
Von außen sieht die RTX 4090 FE beim ersten Blick geradezu massiv aus, aber die Abmessungen sind mehr oder weniger zur RTX 3090 FE identisch. Die 4090 FE ist etwas dicker (61 mm vs. 57 mm der RTX 3090 FE) während die RTX 3090 FE mit 313 mm etwas länger als die 304 mm der 4090 FE ausfällt.
Die RTX 4090 FE ist minimal länger als ein E-ATX-Mainboard und belegt drei PCIe-Slots, was man beim Kauf unbedingt mit einplanen sollte. Für einen optimalen Luftfluss empfiehlt es sich auf ausreichend Platz zwischen der Karte und dem Frontlüfter zu achten.
Abgesehen von den Abmessungen gibt es kaum ästhetische Unterschiede zur RTX 3090 FE. Das Design ist simple, unaufdringlich, aber extrem funktional.
Auch das Kühlsystem erinnert mit seinem Look und der Funktionsweise an die vergangene Generation — ein Lüfter zieht Luft von der Unterseite an, während der zweite Lüfter die Abwärme der Karte ansaugt und ans andere Ende, normalerweise zur Gehäuseoberseite, wieder abgibt. Das bedeutet, dass wenn man die Karte auf konventionelle Weise einbaut, man darauf achten sollte, dass die Radiallüfter am oberen Ende des Gehäuses sitzen sollten, damit sich keine Hitzestaus bilden.
Die Anschlussmöglichkeiten sind gleich geblieben, nur der NVLink-Connector wurde nun gestrichen, bei den Boards der RTX 3090 (Ti) gab es ihn noch. Es gibt drei DisplayPort 1.4a Outs und einen HDMI-2.1a-Port.
Nvidia scheint der Meinung zu sein, dass der Markt noch nicht reif für DisplayPort 2.1 ist, während sich AMD für die kommenden RDNA-3-Karten AMD Radeon RX 7900 XT und RX 7900 XTX schon damit brütet DisplayPort 2.1 mit UHBR 13.5 zu unterstützen.
Turing-Karten profitierten noch von einer USB-C-Unterstützung, aber diese wurde mit Ampere gestrichen. AMDs kommenden RDNA-3-Karten bieten USB-C hingegen wieder an, sodass sich VR-Headsets und USB-C-Monitore direkt anschließen lassen.
Nvidia hat den PCIe-Gen-5-Stromanschluss erstmals mit der RTX 3090 Ti eingeführt und seine Integration sogar in Add-In-Board-Partnermodellen (AiB) vorgeschrieben. In diesem Jahr hat der PCIe-Gen-5-Connector, welcher nun 12VHPWR-Adapter heißt, viel Kritik einstecken müssen, da sich die Berichte über schmelzende Stecker häufen.
Early Adopters sowie potentielle Käufer machen sich natürlich Sorgen über einen potentiell schmelzenden Stromanschluss, der unter Last schon mal bis zu 600 W aus dem Netzteil ziehen kann.
Nvidia hat nun bestätigt, dass man sich aktiv mit dem Problem auseinandersetzt und dass das Problem nur dann auftreten kann, wenn der Stecker nicht sicher eingesteckt wird. Dennoch sichert das Unternehmen allen betroffenen Kunden Unterstützung zu und gibt an den Reklamationsprozess in dieser Sache zu beschleunigen.
Da wir keine ATX-3-PSU- oder modifizierte Kabel zur Hand haben, verwenden wir den beiliegenden 12VHPWR-Adapter von 16-Pin auf 4x 8-Pin.
Glücklicherweise scheint unser Adapter auch nach vielen intensiven Stunden Stress Test, Gaming und Overclocking noch intakt zu sein.
Wer sich damit zufrieden gibt die RTX 4090 bei 450 W laufen zu lassen, kann theoretisch auch einfach eine 3x 8-Pin-Verbindung zum PSU verwenden. Die vierte 8-Pin-Verbindung benötigt man nur beim Übertakten oder beim Erhöhen des TGP-Limits der Karte.
Die Sensor-Pins im 12VHPWR informieren die GPU darüber wie viele 8-Pins verbunden sind, woraufhin die Karte die TGP anpassen kann. Wer weniger als drei 8-Pin-Verbindungen verwendet, wird feststellen, dass die Karte nicht bootet.
Die RTX 4090 FE läuft auf einem Basistakt von 2.235 MHz und kann auf bis zu 2.520 MHz hoch boosten, alles im Standard Power Profil. Darüber hinaus ist es möglich das Energieziel um 33% auf 600 W anzuheben.
Das Testsystem: Core i9-13900K trifft auf RTX 4090 FE
Wer die RTX 4090 zur vollen Entfaltung kommen lassen möchte, benötigt eine moderne CPU wie AMD Zen 4 oder Intel Alder Lake/Raptor Lake, beispielsweise sind der AMD Ryzen 9 7900X/7950X oder der Intel Core i9-13900K würdige Begleiter einer RTX 4090.
Setzt man stattdessen noch auf eine AM4-Plattform, so kann auch der Ryzen 7 5800X3D eine gute Option darstellen. Allerdings können andere AM4-CPUs, inklusive dem Ryzen 9 5950X, schnell zum Flaschenhals für die RTX 4090 mutieren, besonders in Auflösungen unterhalb von QHD.
In unserem ersten Test mit einem Ryzen 9 5950X stellten wir fest, dass die Leistung der RTX 4090 bei 1080p von der CPU derart ausgebremst wurde, dass die Ergebnisse in dieser Auflösung bei diversen Einstellungen kaum besser waren als bei einer RTX 3090 Ti. Daher setzen wir nun auf ein System mit dem Core i9-13900K.
Wir haben die folgenden Komponenten in unserem Testsystem verwendet:
- Cooler Master MasterFrame 700 Gehäuse
- Intel Core i9-13900K
- Gigabyte Z790 Aorus Master Mainboard
- Gigabyte Aorus Gen 4 2 TB NVMe SSD für Benchmarks und Games
- 2x 16 GB Kingston Fury Beast DDR5-6000 RAM mit den Timings 36-38-38-80 at 1.35 V
- Gigabyte M28U 4K 144 Hz Monitor
- Cooler Master MasterLiquid ML360L V2 ARGB AIO Kühler
- Cooler Master MVE Gold 1250 V2 fully modular PSU
Genutzt wurde eine frische Installation von Windows 11 22H2 mit den aktuellen Patches zusammen mit dem Game Ready Driver in der Version 526.47.
Wir möchten an dieser Stelle Cooler Master für das Gehäuse, AIO und PSU, Gigabyte für den Core i9-13900K, das Z790-Mainboard, den M28U-Monitor und die NVMe-SSD, sowie AMD für den Kingston-DDR5-RAM danken.
Synthetische Benchmarks: Slam Dunk für die RTX 4090
Alle synthetischen Benchmarks zusammengenommen kommt die RTX 4090 FE auf einen Vorsprung von saftigen 51% gegenüber der RTX 3090 Ti und 58% gegenüber der RTX 3090 FE sowie der Radeon RX 6950 XT.
Dabei hat die Radeon RX 6950 XT in den Grafiktests der synthetischen Benchmarks einen erkennbaren Vorteil gegenüber der RTX 3090 Ti. Es dürfte spannend sein zu sehen wie sich die neuen RDNA-3-Karten nächsten Monat schlagen, aber für den Moment hat die RTX 4090 FE einen komfortablen Vorsprung erarbeitet. Interessanterweise liegt die RX 6950 XT im Fire Strike Graphics Test nur 9% hinter der 4090 FE, während sie in anderen Benchmarks, wie dem Time Spy Graphics Tests, bis zu 40% hinterher hinkt.
Unigine-Tests fallen meistens eh positiv für Nvidia-Karten aus und hier führt die RTX 4090 FE besonders stark. Wir sehen Verbesserungen von über 50% gegenüber der RTX 3090 Ti, und das sowohl im Heaven 4.0 als auch im Valley 1.0 OpenGL.
In Superposition, vor allem in höheren Auflösungen, zerlegt die RTX 4090 FE die RX 6950 XT geradezu mit über 93% Vorsprung. Auch gegenüber der RTX 3090 Ti führt sie noch mit 79%.
3DMark 11 Performance | 64966 Punkte | |
3DMark Ice Storm Standard Score | 300753 Punkte | |
3DMark Cloud Gate Standard Score | 85501 Punkte | |
3DMark Fire Strike Score | 47404 Punkte | |
3DMark Fire Strike Extreme Score | 37848 Punkte | |
3DMark Time Spy Score | 32177 Punkte | |
Hilfe |
Compute Benchmarks: Chartstürmende Leistung
Die Leistungshegemonie der RTX 4090 FE setzt sich in den Compute Benchmarks fort. Im ComputeMark kommt das Ada-Flaggschiff auf einen Gesamtvorsprung von 93% gegenüber der RX 6950XT und eine signifikante Führung von 66% zur RTX 3090 Ti.
LuxMark präsentiert uns allerdings ein interessantes Paradigma: Während die RTX 4090 FE im Room Test noch vernichtende 150% vor der RX 6950XT liegt, schneiden AMD-Karten im Sala Test besser ab.
* ... kleinere Werte sind besser
Profi-Anwendungen: Power-Hardware mit limitierenden Treibern als Handicapp
Alleine durch ihre schiere Hardware-Power kann die RTX 4090 eine signifikant bessere Leistung in Pro-Apps abrufen als die Consumerkarten der letzten Generation. Am Ende handelt es sich jedoch noch immer um eine GeForce-Karte, deren Leistung in solchen Anwendungen künstlich durch den Treiber limitiert wird.
Was der Treiber ausmacht sieht man an der RTX A6000 auf GA102-Basis, sie hat in den SPECviewperf-Tests einen Vorteil von 109%, alleine durch die Treiberoptimierungen. Aus dem gleichen Grund hat sogar die mobile Turing-Karte Quadro RTX 5000 in Solidworks und Siemens NX Vorteile, auch wenn sie wiederum in Lasten wie 3Ds Max und Maya den Kürzeren zieht.
Nvidia erlaubt die Änderung des VRAM ECC State sogar in den Game Ready Treibern. Gamern nützt das zwar nichts, da durch die Option die Speichergeschwindigkeit sinken kann. Für Profis könnte die Funktion jedoch bei der Ausführung lang-rechnender Simulationen nützlich sein, wenn sie den massiven VRAM der RTX 4090 nutzen wollen ohne viel Geld für die Quadros auszugeben.
Nvidia GeForce RTX 4090 FE i9-13900K | NVIDIA GeForce RTX 3090 Ti R7 5800X3D | AMD Radeon RX 6950 XT R9 5900X | AMD Radeon RX 6900 XT R9 5950X | AMD Radeon RX 6800 XT R9 5950X | NVIDIA GeForce RTX 3090 i9-13900K | 4x NVIDIA RTX A6000 TR Pro 3975WX | NVIDIA RTX A6000 TR Pro 3975WX | Durchschnittliche NVIDIA GeForce RTX 3090 | Durchschnittliche NVIDIA GeForce RTX 3080 | Durchschnittliche NVIDIA GeForce RTX 3080 Ti | Durchschnittliche NVIDIA Titan RTX | Durchschnittliche NVIDIA RTX A5000 Laptop GPU | Durchschnittliche NVIDIA Quadro RTX 5000 (Laptop) | Durchschnitt der Klasse Desktop | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
SPECviewperf 12 | -43% | -20% | -16% | -27% | -34% | 96% | 109% | -38% | -56% | -34% | 67% | 27% | 24% | -27% | |
1900x1060 Solidworks (sw-03) | 119 | 85.7 -28% | 157 32% | 167 40% | 150 26% | 106 -11% | 208 75% | 225 89% | 96.7 ? -19% | 68.6 ? -42% | 103.7 ? -13% | 164.8 ? 38% | 168.2 ? 41% | 156.7 ? 32% | 100.8 ? -15% |
1900x1060 Siemens NX (snx-02) | 28.8 | 15.6 -46% | 49.4 72% | 47.7 66% | 45.07 56% | 17.1 -41% | 333 1056% | 351 1119% | 16.1 ? -44% | 13.1 ? -55% | 16.7 ? -42% | 264 ? 817% | 167.3 ? 481% | 184 ? 539% | 29.5 ? 2% |
1900x1060 Showcase (showcase-01) | 410 | 265 -35% | 308 -25% | 241 -41% | 223 -46% | 263 -36% | 237 -42% | 255 -38% | 257 ? -37% | 190 ? -54% | 256 ? -38% | 193.8 ? -53% | 110.3 ? -73% | 104.3 ? -75% | 232 ? -43% |
1900x1060 Medical (medical-01) | 288 | 87.1 -70% | 58.3 -80% | 88.4 -69% | 77.3 -73% | 90 -69% | 156 -46% | 159 -45% | 93 ? -68% | 43.9 ? -85% | 124.8 ? -57% | 94.6 ? -67% | 69.8 ? -76% | 109.3 ? -62% | 143.6 ? -50% |
1900x1060 Maya (maya-04) | 324 | 197 -39% | 90.7 -72% | 151 -53% | 118 -64% | 306 -6% | 147 -55% | 144 -56% | 268 ? -17% | 165.3 ? -49% | 294 ? -9% | 184 ? -43% | 113.8 ? -65% | 121.4 ? -63% | 169.4 ? -48% |
1900x1060 Energy (energy-01) | 82.6 | 27.6 -67% | 23 -72% | 30.8 -63% | 28.39 -66% | 26 -69% | 39.3 -52% | 39.8 -52% | 25.2 ? -69% | 17.4 ? -79% | 26.7 ? -68% | 28.7 ? -65% | 16.9 ? -80% | 26 ? -69% | 81.8 ? -1% |
1900x1060 Creo (creo-01) | 122 | 76.4 -37% | 115 -6% | 127 4% | 119 -2% | 101 -17% | 127 4% | 136 11% | 89.9 ? -26% | 69.9 ? -43% | 96.3 ? -21% | 153.8 ? 26% | 151.3 ? 24% | 144.4 ? 18% | 124 ? 2% |
1900x1060 Catia (catia-04) | 274 | 150 -45% | 199 -27% | 292 7% | 238 -13% | 177 -35% | 208 -24% | 229 -16% | 161.4 ? -41% | 121.1 ? -56% | 172 ? -37% | 239 ? -13% | 177.3 ? -35% | 159 ? -42% | 151.8 ? -45% |
1900x1060 3ds Max (3dsmax-05) | 473 | 371 -22% | 484 2% | 318 -33% | 167 -65% | 369 -22% | 245 -48% | 336 -29% | 364 ? -23% | 276 ? -42% | 373 ? -21% | 284 ? -40% | 193.9 ? -59% | 279 ? -41% | |
SPECviewperf 13 | -40% | -10% | -17% | -24% | -36% | 98% | 110% | -41% | -52% | -37% | 58% | 9% | 8% | -27% | |
Solidworks (sw-04) | 190 | 118 -38% | 210 11% | 214 13% | 193 2% | 154 -19% | 191 1% | 192 1% | 136.3 ? -28% | 94.5 ? -50% | 150.7 ? -21% | 169.6 ? -11% | 151.3 ? -20% | 144.1 ? -24% | 131.5 ? -31% |
Siemens NX (snx-03) | 51.4 | 28 -46% | 89.7 75% | 85.8 67% | 81.4 58% | 30.7 -40% | 604 1075% | 638 1141% | 28.1 ? -45% | 23.7 ? -54% | 30.1 ? -41% | 477 ? 828% | 298 ? 480% | 307 ? 497% | 53.8 ? 5% |
Showcase (showcase-02) | 412 | 265 -36% | 312 -24% | 241 -42% | 232 -44% | 262 -36% | 239 -42% | 255 -38% | 246 ? -40% | 204 ? -50% | 257 ? -38% | 192.8 ? -53% | 117.9 ? -71% | 104.7 ? -75% | 232 ? -44% |
Medical (medical-02) | 182 | 113 -38% | 157 -14% | 148 -19% | 130 -29% | 107 -41% | 180 -1% | 184 1% | 100.6 ? -45% | 95.4 ? -48% | 106.3 ? -42% | 90.1 ? -50% | 114.3 ? -37% | 116.1 ? -36% | 188 ? 3% |
Maya (maya-05) | 838 | 493 -41% | 372 -56% | 395 -53% | 348 -58% | 580 -31% | 405 -52% | 415 -50% | 522 ? -38% | 400 ? -52% | 574 ? -32% | 425 ? -49% | 235 ? -72% | 235 ? -72% | 436 ? -48% |
Energy (energy-02) | 119 | 48.4 -59% | 60.3 -49% | 60.6 -49% | 58.4 -51% | 45.1 -62% | 128 8% | 132 11% | 42.8 ? -64% | 37 ? -69% | 41.4 ? -65% | 52.7 ? -56% | 63.8 ? -46% | 51.7 ? -57% | 63.2 ? -47% |
Creo (creo-02) | 580 | 353 -39% | 323 -44% | 292 -50% | 276 -52% | 397 -32% | 292 -50% | 366 -37% | 366 ? -37% | 288 ? -50% | 398 ? -31% | 344 ? -41% | 233 ? -60% | 231 ? -60% | 595 ? 3% |
Catia (catia-05) | 406 | 230 -43% | 450 11% | 468 15% | 412 1% | 252 -38% | 359 -12% | 371 -9% | 232 ? -43% | 190.2 ? -53% | 251 ? -38% | 374 ? -8% | 262 ? -35% | 239 ? -41% | 224 ? -45% |
3ds Max (3dsmax-06) | 474 | 373 -21% | 483 2% | 317 -33% | 284 -40% | 369 -22% | 247 -48% | 338 -29% | 348 ? -27% | 266 ? -44% | 372 ? -22% | 283 ? -40% | 196 ? -59% | 187.5 ? -60% | 279 ? -41% |
SPECviewperf 2020 | -40% | -21% | -30% | -28% | -24% | 57% | 104% | -35% | -46% | -32% | 64% | -6% | -7% | ||
3840x2160 Solidworks (solidworks-05) | 305 | 197 -35% | 125 -59% | 112 -63% | 108 -65% | 192 -37% | 141 -54% | 169 -45% | 178 ? -42% | 158 ? -48% | 184 ? -40% | 171.2 ? -44% | 82.6 ? -73% | 323 ? 6% | |
3840x2160 Siemens NX (snx-04) | 44 | 23.7 -46% | 88.6 101% | 85 93% | 81.7 86% | 25.6 -42% | 367 734% | 481 993% | 23.7 ? -46% | 19.8 ? -55% | 25.2 ? -43% | 372 ? 745% | 152.3 ? 246% | 37.7 ? -14% | |
3840x2160 Medical (medical-03) | 39.3 | 22.2 -44% | 34.4 -12% | 30.4 -23% | 27.84 -29% | 20.3 -48% | 32.1 -18% | 37.9 -4% | 19.8 ? -50% | 18.5 ? -53% | 21.8 ? -45% | 18.6 ? -53% | 22.8 ? -42% | 21.9 ? -44% | |
3840x2160 Maya (maya-06) | 508 | 353 -31% | 296 -42% | 266 -48% | 224 -56% | 356 -30% | 262 -48% | 329 -35% | 339 ? -33% | 293 ? -42% | 356 ? -30% | 278 ? -45% | 127.7 ? -75% | 542 ? 7% | |
3840x2160 Energy (energy-03) | 65.3 | 31.6 -52% | 47.6 -27% | 32.6 -50% | 60.8 -7% | 101 55% | 46.1 -29% | 63 -4% | 63.1 ? -3% | 51.7 ? -21% | 64.3 ? -2% | 50.1 ? -23% | 87.1 ? 33% | 113.3 ? 74% | |
3840x2160 Creo (creo-03) | 142 | 84.5 -40% | 73.1 -49% | 65.4 -54% | 65 -54% | 118 -17% | 75.6 -47% | 111 -22% | 107.1 ? -25% | 77.6 ? -45% | 113 ? -20% | 127.5 ? -10% | 93.3 ? -34% | 78 ? -45% | |
3840x2160 CATIA (catia-06) | 95.6 | 58.6 -39% | 53 -45% | 44.6 -53% | 42.4 -56% | 60.4 -37% | 67.5 -29% | 82.4 -14% | 56.8 ? -41% | 50 ? -48% | 59.6 ? -38% | 83.8 ? -12% | 58.4 ? -39% | 54.9 ? -43% | |
3840x2160 3ds Max (3dsmax-07) | 213 | 145 -32% | 144 -32% | 121 -43% | 114 -46% | 143 -33% | 95.7 -55% | 137 -36% | 134.3 ? -37% | 100 ? -53% | 139.3 ? -35% | 119.4 ? -44% | 83.9 ? -61% | 226 ? 6% | |
Durchschnitt gesamt (Programm / Settings) | -41% /
-41% | -17% /
-17% | -21% /
-21% | -26% /
-26% | -31% /
-31% | 84% /
85% | 108% /
108% | -38% /
-38% | -51% /
-52% | -34% /
-34% | 63% /
63% | 10% /
10% | 16% /
16% | -20% /
-21% |
Game-Benchmarks: Hervorragende Raster- und RT-Leistung
Gamer, welche mit dem Kauf einer RTX 4090 liebäugeln, werden über den Anstieg der Rasterleistung, verglichen mit der RTX 3090 Ti oder der RX 6950 XT, begeistert sein. Explizite Gewinne hängen vom jeweiligen Spiel ab und es besteht die Möglichkeit, dass nicht jedes Spiel linear mit der erhöhten Shaderanzahl skaliert. Je nach Game Engine erreicht man also womöglich fps-Obergrenzen.
Insgesamt kann die RTX 4090 durchschnittlich um 39%, 59% und 63% schneller sein als eine RTX 3090 Ti, eine RX 6950 XT und eine and RTX 3090.
Ray-Tracing-Leistung
Die neue Ada-Architektur kommt mit 128 Gen3 RT-Cores, was eine Aufstockung um 52% gegenüber Ampere bedeutet. Fundamentale Neuerung in den RT Cores sind zwei neue Funktionen — die Opacity Micromap Engine und die Displaced Micro-Mesh Engine — zusätzlich zu der Box Intersection Engine und der Triangle Intersection Engine, welches es schon bei Ampere gab.
Adas RT Cores verfügen auch über ein neues Shader Execution Reordering (SER) Scheduling System, welches Threads für Sekundärstrahlen effizient für Effekte wie Pfadverfolgung, Reflexionen, indirekte Beleuchtung und Lichtdurchlässigkeit effizient neu ordnet. Allerdings müssen Entwickler SER über eine API speziell ansteuern, um deren Vorteile nutzen zu können.
Die Box Intersection Engine (dargestellt durch die Bereiche links im Diagramm) führt Bounding Volume Hierarchy (BVH)-Traversal durch, während die Triangle Intersection Engine Ray-Triangle-Intersections (Strahlen-Dreieck-Schnitttests) berechnet.
Nvidia gibt an, dass Adas RT Cores dank der Displaced Micro-Mesh Engine Ray-Tracing auf komplexe Geometrie anwenden kann, die Engine generiert Netze/Meshes von Mikro-Dreiecken und beschleunigt Alpha Traversals, welche die Opacity Micromap Engine zur Verfügung stellt.
Zwar ist es anerkennenswert, dass Nvidia in fortschrittlicher RT-Rendertechnik investiert, aber die realen Ergebnisse repräsentieren nicht immer einen Generationssprung in Sachen Leistung. Beispielsweise zeigt sich in Metro Exodus (nicht die Enhanced Edition) nur ein kleiner Vorteil von 5% der RTX 4090 gegenüber der RTX 3090 Ti im Ingame-Benchmark Taiga.
Die RT-Fortschritte zeigen sich so langsam in Titeln wie Control und Dying Light 2, welche um die 42% bei 1080p ohne DLSS gegenüber einer RTX 3090 Ti profitieren. Far Cry 6 und Watch Dogs: Legion zeigen ebenfalls etwas größere Vorteile der RT-Fähigkeiten der RTX 4090.
Die vermutlich höchsten Vorteile sehen wir in Cyberpunk 2077 und Ghostwire: Tokyo, welche reichlich Gebrauch von RT-Reflexionen und -Schatten machen. Cyberpunk 2077 erzeugt einen Vorsprung von 75% der RT-Leistung gegenüber einer RTX 3090 Ti bei 4K Ultra ohne DLSS und einer Ultra-RT-Qualität. Dennoch liegen die Zahlen noch immer unterhalb der magischen 60-fps-Grenze.
Die RT-Leistung in 1080p in den Titeln Cyberpunk 2077 und Ghostwire: Tokyo erlebt mit Ada einen signifikanten Anstieg gegenüber den "alten" Ampere-Flaggschiffen.
Watch Dogs Legion - 1920x1080 Ultra Preset + Ultra Ray Tracing (DX12) | |
Nvidia GeForce RTX 4090 FE | |
Durchschnitt der Klasse Desktop (75.3 - 99.9, n=6, der letzten 2 Jahre) | |
NVIDIA GeForce RTX 3090 Ti | |
Durchschnittliche NVIDIA GeForce RTX 3090 (75.7 - 110, n=3) | |
Durchschnittliche NVIDIA GeForce RTX 3080 Ti () | |
AMD Radeon RX 6800 XT | |
Durchschnittliche NVIDIA GeForce RTX 3080 (70.9 - 71.3, n=2) | |
AMD Radeon RX 6950 XT | |
AMD Radeon RX 6900 XT | |
AMD Radeon RX 6900 XT (SAM ENABLED) | |
Durchschnittliche NVIDIA Titan RTX () |
Cyberpunk 2077 1.6 | |
3840x2160 Ray Tracing Ultra Preset (DLSS off) | |
Nvidia GeForce RTX 4090 FE (1.6) | |
Durchschnitt der Klasse Desktop (15.3 - 43.8, n=9, der letzten 2 Jahre) | |
NVIDIA GeForce RTX 3090 Ti (1.52) | |
Durchschnittliche NVIDIA GeForce RTX 3090 (19.8 - 22.1, n=6) | |
Durchschnittliche NVIDIA GeForce RTX 3080 Ti () | |
Durchschnittliche NVIDIA Titan RTX () | |
Durchschnittliche NVIDIA GeForce RTX 3080 () | |
1920x1080 Ray Tracing Ultra Preset (DLSS off) | |
Nvidia GeForce RTX 4090 FE (1.6) | |
Durchschnitt der Klasse Desktop (60 - 130.1, n=9, der letzten 2 Jahre) | |
NVIDIA GeForce RTX 3090 Ti (1.52) | |
Durchschnittliche NVIDIA GeForce RTX 3080 Ti () | |
Durchschnittliche NVIDIA GeForce RTX 3090 (61.3 - 70.4, n=6) | |
Durchschnittliche NVIDIA GeForce RTX 3080 () | |
Durchschnittliche NVIDIA Titan RTX () |
Ghostwire Tokyo - 1920x1080 Highest Settings + Maximum Ray Tracing | |
Nvidia GeForce RTX 4090 FE | |
Durchschnitt der Klasse Desktop (112.2 - 176.9, n=7, der letzten 2 Jahre) | |
NVIDIA GeForce RTX 3090 Ti | |
Durchschnittliche NVIDIA GeForce RTX 3080 Ti () | |
Durchschnittliche NVIDIA GeForce RTX 3090 (106 - 122, n=4) | |
Durchschnittliche NVIDIA GeForce RTX 3080 () | |
Durchschnittliche NVIDIA Titan RTX (74.5 - 79, n=2) |
min. | mittel | hoch | max. | QHD | 4K | |
---|---|---|---|---|---|---|
GTA V (2015) | 188 | 187.9 | 187.4 | 168.6 | 167.9 | 187.6 |
The Witcher 3 (2015) | 747 | 666 | 606 | 297 | 274 | |
Dota 2 Reborn (2015) | 292.4 | 268.3 | 252.6 | 239.8 | 228.9 | |
Final Fantasy XV Benchmark (2018) | 236 | 233 | 230 | 220 | 151.5 | |
X-Plane 11.11 (2018) | 251 | 216 | 164.8 | 138.6 | ||
Far Cry 5 (2018) | 239 | 222 | 215 | 203 | 207 | 176 |
Shadow of the Tomb Raider (2018) | 324 | 316 | 315 | 306 | 282 | 182 |
Metro Exodus (2019) | 273 | 250 | 215 | 191.2 | 176 | 135 |
Total War: Three Kingdoms (2019) | 642 | 422 | 332 | 268 | 188 | 100 |
Control (2019) | 233 | 238 | 238 | 201 | 107.7 | |
Borderlands 3 (2019) | 242 | 217 | 203 | 201 | 190 | 133.4 |
Doom Eternal (2020) | 855 | 826 | 679 | 680 | 572 | 364 |
Mafia Definitive Edition (2020) | 291 | 267 | 255 | 238 | 160.2 | |
Watch Dogs Legion (2020) | 189.5 | 187.7 | 172.5 | 160.3 | 151.9 | 111.6 |
Assassin´s Creed Valhalla (2020) | 303 | 274 | 235 | 206 | 173 | 120 |
F1 2021 (2021) | 663 | 616 | 573 | 289 | 273 | 192 |
Far Cry 6 (2021) | 234 | 214 | 193 | 182 | 175 | 132 |
Call of Duty Vanguard (2021) | 286 | 329 | 301 | 239 | 161.4 | |
Forza Horizon 5 (2021) | 388 | 275 | 266 | 198 | 186 | 151 |
Rainbow Six Extraction (2022) | 530 | 489 | 468 | 446 | 343 | 198 |
Dying Light 2 (2022) | 363 | 315 | 276 | 204 | 105.2 | |
Cyberpunk 2077 1.6 (2022) | 241 | 233 | 222 | 210 | 147 | 77.8 |
Ghostwire Tokyo (2022) | 301 | 300 | 302 | 301 | 299 | 167.2 |
F1 22 (2022) | 387 | 411 | 381 | 199.2 | 149.6 | 80.5 |
Call of Duty Modern Warfare 2 2022 (2022) | 364 | 335 | 291 | 285 | 216 | 139 |
Ein Hinweis zum DLSS-3-Frame-Generation
Nvidia möchte, dass Gamer das neue DLSS-3-Frame-Generation nutzt, um auch mit aktiviertem RT auf dreistellige fps-Werte zu kommen. DLSS-3-Frame-Generation generiert quasi Zwischenframes zwischen Frame 1 und Frame 2, was theoretisch die Framerate verdoppelt. Allerdings unterstützen bislang nicht alle Spiele dieses Feature und weil die Funktion mit einer erhöhten Latenz einhergeht, ist gleichzeitig auch die Aktivierung von Nvidia Reflex sinnvoll bis nötig.
DLSS 3 ist rückwärts-kompatibel mit DLSS 2 und kann sogar unabhängig voneinander aktiviert oder in Kombination mit anderen Upscalern wie Intel XeSS oder AMD FSR genutzt werden. Der Aspekt der Superauflösung hat sich nicht geändert, aber hier wird auch die Grenze für RTX 30-Besitzer gezogen. Denn Ampere verwendet zwar ebenfalls einen Standalone Optical Flow Accelerator (OFA), aber die Variante in Ada ist laut Nvidia zweimal so leistungsstark und kann eine Performance von 300 TOPS liefern. Daher wird DLSS-3-Frame-Generation nicht auf Ampere-GPUs unterstützt und ist bislang Ada-exklusiv.
Frame-Generation kann ein Segen für Spiele mit CPU-Begrenzung sein. Allerdings sollte bedacht werden, dass Frame-Generation nicht an der Quelle geschieht, sodass die CPU noch immer limitiert werden kann. Ob man die eingefügten Frames wahrnehmen kann oder nicht, hängt von der gesamten Implementierung ab und davon, wie schnell die Action im Spiel ist.
Die meisten PresentMon-basierten Programme wie CapFrameX, welches wir regelmäßig für unsere Gaming-Tests verwenden, registrieren möglicherweise nicht immer die Zwischenframes. Um also akkurate fps-Werte bei Frame-Generation messen zu können, sollte man Nvidias FrameView 1.4 verwenden.
AMD will nächstes Jahr ebenfalls eine eigene Frame-Generation-Technik namens Fluid Motion Frame im kommenden FSR-3-Update anbieten, dann hoffentlich mit cleveren Maschine-Learning-Algorithmen. Vergleiche zwischen DLSS 3 und FSR 3 dürften spannend werden.
Emissionen: Hervorragende Wärmeableitung und Lüfterlautstärke im Referenzdesign
Nvidia trifft bereits seit einiger Zeit mit seinem thermischen Design beim Referenzmodell voll ins Schwarze und die RTX 4090 FE bildet da keine Ausnahme. Die meiste Zeit ist die Ada-Flaggschiff-Referenzkarte ein kühler Geselle, die Lüfterlautstärke bleibt selbst unter Last im tolerablen Bereich.
Erwähnt sei, dass die Übertaktung unter Ada etwas anders funktioniert als bei Ampere. Amperes Boost-Algorithmus setzte auf die Powerlimits, um die Taktraten hoch zu schrauben. Nvidia gibt an, dass Ada deutlich energieeffizienter agiere und sich daher zunächst die maximalen Taktraten und Spannungslimits anschaue, um an den Taktraten zu drehen, erst danach greife die GPU auf die Powerlimits zurück. Theoretisch könnte man dadurch eine bessere Spannungs-Frequenz-Kurve mit dem gleichen Powerlimit bekommen.
In unserem Test gelangen uns +205 MHz Kerntakt, +1650 MHz Speichertakt und ein TGP-Ziel von 133% bei maximierter Kernspannung via MSI Afterburner. Das war unser persönliches Maximum, höhere Werte führten bei uns zu Artefakten im Heaven-4.0-Benchmark. Allerdings dürften nicht alle Lasten derart hohe Einstellungen tolerieren. Beispielsweise führten die gleichen Einstellungen unter FurMark bei 1080p zu einem Treibercrash, während wir beim Durchlauf von 3DMark Port Royal keine Probleme hatten.
Stresstests
Unser Stresstest mit FurMark 1.19 bei 1.280x720 mit deaktiviertem AA zeigt, dass sich die GPU-Taktrate bei 2.591 MHz und einem Power-Target von 100% stabilisiert. Dabei beobachten wir Peaks von bis zu 2.760 MHz bei einem PT von 133% mit einer TGP von bis zu 592 W.
Die Lüfter erreichen beim höheren PT mit 1.876 RPM ein Maximum von 65% der gerateten RPM, normalerweise drehen sie aber recht konstant bei 1.581 RPM unter den Standardeinstellungen. In den gleichen Settings beträgt der Hot Spot annähernd 82 °C, das kann beim Übertakten auf an die 93 °C anwachsen.
Ein ähnliches Muster sehen wir im Witcher-3-Stress in 1080p Ultra, allerdings operiert die GPU hier etwas kühler, auch mit Übertaktung erreichen die Hot Spots nur 73 °C. Die Lüftergeschwindigkeit bleibt ebenfalls etwas geringer.
Das dürfte das Ergebnis des deutlich niedrigeren Verbrauchs sein. 306 W werden im Standardmodus und 357 W im OC-Modus verbraucht, was deutlich effizienter ist als die 416 W der Zotac RTX 3090 Ti AMP Extreme Holo im Stresstest, und das ohne OC.
Stressen wir die Karte mit Witcher 3 in 4K Ultra, so erhöht sich die TGP auf maximal 382 W (Standard) und annähernd 445 W (OC). Wir haben in beiden Einstellungen kaum Unterschiede in den Taktraten festgestellt. Allerdings erreichten die Temperaturen Hot Spots von maximal 77,5 °C ohne OC.
The Witcher 3 FPS Chart
The Witcher 3 zeigt sowohl unter 1080p Ultra als auch 4K Ultra eine stabile Framerate, was darauf hindeutet, dass das Kühlsystem es der Karte ermöglicht ohne Drosselung ihr volles Potential entfalten zu können.
Oberflächentemperaturen
Dank der effizienten Kühlung bleiben die Oberflächentemperaturen der RTX 4090 FE im tolerablen Bereich. Wir messen maximal 64 °C an der Oberfläche im Stresstest bei einer Umgebungstemperatur von 23 °C. Die Temperatur in der nähe des Power-Adapters ist dabei relativ gering, die gemessenen 45 °C bieten keinen Anlass zur Sorge vor einem Durchschmoren.
Lautstärke
Wir messen die Lüfterlautstärke in einem festen Gehäuseabstand von 20 cm, alle Gehäuselüfter sind dabei mit Ausnahme der Cooler Master AIO Pump deaktiviert. Bei einer Umgebungslautstärke von 22,1 dB(A) messen wir eine Idle-Lautstärke von 23,47 dB(A).
Bei 100% Power regt der FurMark-Stress die Lüfter zu einer Geschwindigkeit von 53% an, was in einer Lautstärke von 44,42 dB(A) resultiert. Bei übertakteten 133% Power drehen die Lüfter bei 65%, die Lautstärke steigt auf höhere 49,13 dB(A) Sound Pressure Level (SPL).
Ähnlich ist es in The Witcher 3 bei 1080p Ultra: Bei 100% Power kommt man auf 43% Lüfter-RPM und ein SPL von 40,79 dB(A). Bei übertakteten 133% Power ergeben sich 47% Lüfter-RPM und eine Lüfterlautheit von 43,09 dB(A).
Nvidia implementiert einen kompletten Lüfterstopp, wenn die dedizierte Karte nicht angesteuert wird. Alles in allem hat die RTX 4090 FE in den Standardeinstellungen ein gedämpftes Geräuschprofil. Hier haben Nvidias Founders Editions oftmals signifikante Vorteile gegenüber den Custom-Modellen.
Energieverbrauch: Es drohen hohe Stromrechnungen
Unter den Standardeinstellungen entspricht der totale Energieverbrauch in FurMark mehr oder weniger dem, was wir damals schon bei der RTX 3090 Ti oder RX 6950 XT gemessen haben. Übertaktet frisst die RTX 4090 FE teilweise 25% mehr Energie als eine normale RX 6950 XT. Verglichen mit einer übertakteten Zotac RTX 3090 Ti AMP Extreme Holo liegt der Gesamtverbrauch der RTX 4090 FE OC etwa 9% höher.
In The Witcher 3 erweist sich die RTX 4090 FE in 1080p Ultra allerdings als ökonomischer als eine RX 6950 XT, Letztere hat einen um 18% höheren Energiebedarf als die Standard-RTX-4090. Verglichen mit der übertakteten RTX 4090 FE ist der Verbrauch der AMD-Karte noch immer um 7% höher.
Auch wenn Ada verglichen mit Ampere mehr Leistung bei gleicher TGP verspricht, sollte man sich bei der Nutzung der RTX 4090 FE auf aufgeblähte Stromrechnungen einstellen.
Energieverbrauch: Externer Monitor
* ... kleinere Werte sind besser
Pro
Contra
Fazit: Eine GPU, um sie alle zu beherrschen
Dass die RTX 4090 vor den Mainstream-Karten rund um die RTX 4080 und darunter erscheint, ist ein Zeichen dafür, dass Nvidia allen zeigen möchte wie stark seine neue Ada-Lovelace-Architektur sein kann. Abgesehen von der extremen Steigerung in Sachen CUDA Cores, Tensor Cores und RT Cores und der damit kombinierten Effizienzsteigerung durch TSMCs Custom-4N-Prozess, bringt Ada auch neue Techniken wie Shader Execution Reordering, verbesserte Optical Flow Acceleration sowie neue RT-Funktionen, die es so in Ampere noch nicht gab.
Die RTX 4090 Founders Edition spricht die gleiche Designsprache die für Nvidia auch in der RTX 3090 Founders Edition erfolgreich war. Das erlaubt Nvidia ausgezeichnete Lautstärkelevel und Kühlleistung anzubieten, was die Messlatte für die kommenden Custom-Modelle der AiB-Partner recht hoch hängt.
Die RTX 4090 FE lässt die Zahlen für sich sprechen. Sie ist zweifellos die Helden-GPU ihrer Generation, an die für lange Zeit keine andere Karte heranreichen wird.
Zwar bleiben Probleme mit dem neuen 12VHPWR-Connector besorgniserregend, aber immerhin bietet Nvidia betroffenen Nutzern etwas Hilfe an. Die Leistungswerte benötigen hingegen keiner weiteren Erklärung, es empfiehlt sich aber dennoch ein Blick auf die erwarteten Leistungssteigerungen im eigenen Workflow zu werfen bevor man sich auf die neue Karte stürzt.
Um das Maximum aus der Karte herauszuholen sollte sichergestellt werden, dass es keine potentiellen Flaschenhälse im System gibt. Je nach Spiel und Auflösung könnten selbst die aktuellen Intel Gen13- und AMD-Ryzen-7000-Chips Probleme bekommen die RTX 4090 ordentlich zu füttern.
Die Leistungsgewinne kommen allerdings nicht ohne Preis. Wenn der eigene PC nur wenige Jahre alt ist, muss man gleich in ein komplett neues System investieren. Der Stromverbrauch ist in den Standardeinstellungen ähnlich zu dem der RTX 3090 Ti oder RX 6950 XT, aber insgesamt könnte er dennoch höher liegen.
Die RTX 4090 ist eine Karte der Titanen-Klasse und eignet sich am besten für Profis, die auch spielen. Mainstream-Gamer sind vermutlich mit einer RTX 4080 oder niedrigeren Karte besser beraten. AMDs Zuversicht die Leistung der RTX 4080 zu einem niedrigeren Preis zu überbieten ist sicher ein gutes Zeichen, aber das Urteil dazu heben wir uns für einen Test der RX 7900 XT oder RX 7900 XTX auf.
In diesem Test sind wir nicht auf Aspekte wie den Vergleich der DLSS-3-Bildqualität und die Leistung des dualen NVENC-Encoders eingegangen. Aber momentan ist es wohl keine Übertreibung zu sagen, dass die RTX 4090 eine Karte ist, an der andere GPUs, sowohl konkurrierende als auch aus dem gleichen Hause, aufschauen und sich orientieren werden.
Für $1.599 kostet die GPU $400 weniger als die RTX 3090 Ti FE bei deren Antritt. Das ist eine bemerkenswerte Leistung. In Deutschland kostet sie ab 1.949 Euro.
Preis und Verfügbarkeit
In den einschlägigen Vergleichsportalen wird die RTX 4090 FE nur bei ebay ab 2.400 Euro gelistet. Das ist seltsam, da die GPU auf der Nvidia-Webseite direkt für 1.949 Euro bestellt werden kann. Allerdings ist sie hier aktuell nicht verfügbar, dafür werden alternativ die Custom-Modelle angeboten, deren Preis fängt jedoch erst bei rund 2.000 Euro an.