Die Nvidia GeForce RTX 4090 ist eine High-End-Desktop-Grafikkarte basierend auf die Ada Lovelace Architektur. Sie nutzt den großen AD102 Chip und bietet 16.384 der 18.432 Kerne und 24 GB GDDR6X Grafikspeicher (384 Bit Bus mit 21 Gbits).
Die Raytracing Performance ist dank 128 dedizierter Kerne sehr gut und die 512 Tensor Kerne können für DLSS 3 genutzt werden.
Die Gaming-Performance ist auch ohne DLSS ideal für 4k und erreicht in den meisten Spielen auch höhere Frameraten. Raytracing ist auch ohne DLSS gut nutzbar, jedoch oft bei reduzierter Auflösung. Im Konkurrenzvergleich ist die RTX 4090 Ende 2022 die schnellste Consumer-Grafikkarte und kann die (deutlich günstigere) AMD Radeon RX 7900 XTX hinter sich lassen.
Die aktuell verfügbaren Karten der RTX 4090 sind sehr groß (3 Slots) und nutzen den neuen 12VHPWR Anschluss (bei dem es bei Adaptern zu einigen Problemen kam).
Der AD102 Chip wird bei TSMC in 5nm (4N mit EUV) produziert und ist mit einem TGP (Total Graphics Power) von 450 Watt spezifiziert (Nvidia empfiehlt mind. ein 850 Watt Netzteil).
Die Nvidia GeForce RTX 3050 Laptop GPU (oder Mobile, NVIDIA_DEV.2583, GN20-P0) ist die kleinste Variante der RTX 3000 Serie und basiert auf den GA107 Ampere Chip. Sie bietet 2048 CUDA-, 16 Raytracing und 64 Tensor-Kerne. Der Speicherbus ist mit 128 Bit spezifiziert für maximal 4 GB GDDR6 Grafikspeicher. Die schnellere RTX 3050 Ti bietet 25% mehr Kerne bei ähnlichen Taktraten und gleichem spezifizierten Stromverbrauch. Anfang 2023 gab es einen Refresh der RTX 3050 mit 6GB VRAM, reduziertem Speicherbus und wahrscheinlich höheren Kernzahl.
Wie üblich wird es verschiedene Varianten mit einem TGP von 35 - 50 (ehemals Max-Q) und 60 - 80 Watt geben. Diese takten von 713 - 1530 (Basistakt) bis 1058 - 1740 (Boost) und bieten dementsprechend eine unterschiedliche Performance.
Vorläufige Taktraten
TGP (Power Consumption)
35 W
40 W
45 W
50 W
60 W
70 W
80 W
Base Clock Speed (MHz)
713
938
1065
1178
1238
1403
1530
Boost Clock Speed (MHz)
1057
1223
1343
1455
1500
1635
1740
Die durchschnittliche Leistung liegt etwas unterhalb der alten GeForce GTX 1660 Ti Max-Q. Diese kann jedoch deutlich variieren je nach TGP Variante. Dadurch eignet sich die GPU am Besten für Full HD mit hohen Details. Für Raytracing Effekte reicht die Leistung kaum aus, jedoch können die Tensor-Kerne via DLSS in manchen Spielen zu einer höheren Leistung helfen.
Der GA107 Chip bietet 3.072 FP32 ALUs wovon die Hälfte auch INT32 Befehle ausführen können (also 1.536 INT32 ALUs). Bei Turing konnten noch alle Shader FP32 oder INT32 ausführen. Die Raytracing und Tensor Kerne auf dem Chip wurden laut Nvidia ebenfalls verbessert. Weiters integriert der Ampere Chip einen Hardware Video-Encoder (NVENC 5. Generation für H.264 und H.265) und Decoder (7. Generation für zahlreiche Formate inklusive AV1).
Der GA107 Chip wird bei Samsung im 8nm (8N) Verfahren welches mit dem 7nm Verfahren von TSMC nicht ganz mithalten kann (z.B. von AMD genutzt, aber auch für den professionellen GA100 Ampere Chip).
Die Nvidia GeForce RTX 4080 ist eine High-End-Desktop-Grafikkarte basierend auf die Ada Lovelace Architektur. Sie nutzt den AD103 Chip und bietet 9728 Kerne und 16 GB GDDR6X Grafikspeicher (256 Bit Bus mit 22,4 Gbits).
Die Raytracing Performance ist dank 76 dedizierter Kerne sehr gut und die 304 Tensor Kerne können für DLSS 3 genutzt werden.
Die Gaming-Performance ist ohne DLSS ideal für 4k mit etwa 60fps und 2k mit höheren Frameraten bei anspruchsvollen Spielen ohne Raytracing Effekte (z.B. F1 22 oder Cyberpunk 2077). Mit Raytracing empfiehlt sich der Einsatz von DLSS. Im Konkurrenzvergleich ist die Performance ohne DLSS und Raytracing minimal besser als die deutlich günstigere AMD Radeon RX 7900 XT.
Die aktuell verfügbaren Karten der RTX 4080 sind sehr groß (3 Slots) und nutzen den neuen 12VHPWR Anschluss (bei dem es bei Adaptern zu einigen Problemen kam).
Der AD103 Chip wird bei TSMC in 5nm (4N mit EUV) produziert und ist mit einem TGP (Total Graphics Power) von 320 Watt spezifiziert (Nvidia empfiehlt mind. ein 750 Watt Netzteil).