Die Nvidia RTX A3000 Laptop GPU oder A3000 Mobile (für Laptops) ist eine professionelle Grafikkarte für mobile Workstations. Sie bietet eine ähnliche Performance wie die Consumer GeForce RTX 3060 Laptop GPU und bietet mit 4096 genau 256 CUDA-Kerne mehr (und basiert daher auf den größeren GA104 Chip). Weiters integriert die A3000 32 RT-Kerne und 128 Tensor-Kerne. Im Vergleich zu einer günstigeren GeForce RTX 3070 Laptop GPU mit Studio Treibern, bietet die RTX A3000 zertifizierte Treiber für zahlreiche professionelle Applikationen und wahrscheinlich eine minimal höhere Performance.
In 2022 veröffentlichte Nvidia eine leicht verbesserte Version der RTX A3000 mit mehr und schneller getaktetem Grafikspeicher. Die ursprünglichen 6 GB mit 11 GBits wurden verdoppelt zu 12 GB GDDR6 die mit 14 GBits getaktet werden.
Wie auch die GeForce RTX 3060 Mobile, ist auch die RTX A3000 in verschiedenen TGP-Versionen erhältlich. Diese rangieren bei der A3000 von 60 - 130 Watt und damit im Maximum 15W höher als die RTX 3060 Mobile. Je nach verbauter Variante unterscheiden sich die Taktraten von Chip und Speicher und damit auch deutlich die Performance.
Es gibt nun keine Max-Q Variante mehr (die 60 - 90 Watt Versionen heissen auch nur "Laptop GPU"), aber jede TGP-Version kann die Max-Q Technologien nutzen (Dynamic Boost, WhisperMode).
Die professionellen Grafikkarten von Nvidia bieten zertifizierte Treiber, welche auf Stabiltität und Performance bei professionellen Anwendungen (CAD-, DCC-, Medizin-, Prospektions-, Visualisierungsanwendungen) optimiert sind.
Die Leistung ist abhängig von der TGP-Variante und der verwendeten Kühlung. Bei gleichem TGP sollte sie aber deutlich oberhalb einer alten Quadro RTX 3000 bzw. RTX 3000 Max-Q für Laptops liegen.
Der GA104 Chip bietet 6.144 FP32 ALUs wovon die Hälfte auch INT32 Befehle ausführen können (also 3.072 INT32 ALUs). Bei Turing konnten noch alle Shader FP32 oder INT32 ausführen. Die Raytracing und Tensor Kerne auf dem Chip wurden laut Nvidia ebenfalls verbessert. Die RTX A4000 nutzt jedoch nur 4.096 der 6.144 Kerne.
Der GA104 Chip wird bei Samsung im 8nm (8N) Verfahren welches mit dem 7nm Verfahren von TSMC nicht ganz mithalten kann (z.B. von AMD genutzt, aber auch für den professionellen GA100 Ampere Chip).
Die Nvidia GeForce RTX 4090 ist eine High-End-Desktop-Grafikkarte basierend auf die Ada Lovelace Architektur. Sie nutzt den großen AD102 Chip und bietet 16.384 der 18.432 Kerne und 24 GB GDDR6X Grafikspeicher (384 Bit Bus mit 21 Gbits).
Die Raytracing Performance ist dank 128 dedizierter Kerne sehr gut und die 512 Tensor Kerne können für DLSS 3 genutzt werden.
Die Gaming-Performance ist auch ohne DLSS ideal für 4k und erreicht in den meisten Spielen auch höhere Frameraten. Raytracing ist auch ohne DLSS gut nutzbar, jedoch oft bei reduzierter Auflösung. Im Konkurrenzvergleich ist die RTX 4090 Ende 2022 die schnellste Consumer-Grafikkarte und kann die (deutlich günstigere) AMD Radeon RX 7900 XTX hinter sich lassen.
Die aktuell verfügbaren Karten der RTX 4090 sind sehr groß (3 Slots) und nutzen den neuen 12VHPWR Anschluss (bei dem es bei Adaptern zu einigen Problemen kam).
Der AD102 Chip wird bei TSMC in 5nm (4N mit EUV) produziert und ist mit einem TGP (Total Graphics Power) von 450 Watt spezifiziert (Nvidia empfiehlt mind. ein 850 Watt Netzteil).
Die Nvidia GeForce RTX 4060 Ti 16 GB ist eine Mid-Range-Desktop-GPU und wird im 5 nm Verfahren bei TSMC gefertigt. Neben dem 8-GB-Modell gibt es nun auch ein 16-GB-Modell, welches vordergründig bei leistungshungrigen Spielen einen spürbaren Mehrwert bieten soll. Mit den beiden GeForce RTX 4060 Modellen rundet Nvidia sein aktuelles Line-up der Ada-Lovelace weiter in Richtung Mittelklasse ab. Als Chip kommt hier der AD106 zum Einsatz. Dieser vereint 4.352 Schadereinheiten und 16-GB-GDDR6 stehen hier zur Verfügung. Das Speicherinterface beträgt 128 Bit, woraus eine Speicherbandbreite von 288 GB/s resultiert.
Features
Die bereits mit den High-End-Modellen der Ada-Lovelace-Generation Einzug gehaltenen Features, wie DLSS 3.0 mit Framegeneration, wird der Nvidia GeForce RTX 4060 Ti 16 GB nicht vorenthalten. Damit hebt sich die neue Mittelklasse von der Nvidia GeForce RTX 3060 Ti deutlich ab und kann in Spielen, welche diese Features bieten, einen deutlichen Vorteil erlangen.
Performance
Ohne DLSS ist die Leistung reine Rasterleistung mit einer Nvidia GeForce RTX 4060 Ti 8 GB vergleichbar. Gegenüber einer Nvidia GeForce RTX 3060 Ti kann die Nvidia GeForce RTX 4060 Ti 16 GB etwa 10 Prozent mehr Leistung erbringen. Gegenüber AMD positioniert sich die Nvidia GeForce RTX 4060 Ti 16 GB mit einem kleinen Vorsprung vor der Radeon RX 7600. Die 16-GB-VRAM machen sich in einigen Spielen aber positiv bemerkbar. Mitunter sehen wir deutlich besserer Frameraten bei den Spielen, wo es mit 8-GB-VRAM eng wird. Das anvisierte Ziel einer guten Gaming-GPU für den1.080p-Gaming-Bereich ist Nvidia geglückt und mit dem 16-GB-VRAM ist die Nvidia GeForce RTX 4060 Ti das interessantere Modell der beiden RTX 4060 Ti Modelle. Leider verlangt Nvidia einen saftigen Aufpreis für den größeren VRAM. Damit hat es die Nvidia GeForce RTX 4060 Ti 16 GB nicht unbedingt leichter sich im Markt zu positionieren.
Leistungsaufnahme
Die Leistungsaufnahme der Nvidia GeForce RTX 4060 Ti 16 GB wird vom Hersteller mit 165 Watt (TDP) angegeben. Das sind 5 Watt mehr als beim 8-GB-Modell. Um den Grafikchip nicht mit weniger Energie versorgen zu müssen, war eine Erhöhung der Leistungsaufnahme unumgänglich. Gegenüber der Nvidia GeForce RTX 3060 Ti ist die Nvidia GeForce RTX 4060 Ti 16 GB allerdings weiterhin deutlich sparsamer.
DisplayPort 1.4, HDMI 2.1, PCIe 4.0 x16, 12.8 SP-FP TFLOPS Peak, 102 Tensor Performance Peak, up to 264 GB/s Memory Bandwidth, Resizable BAR, Support for Modern Standby