NVIDIA RTX A4000 Laptop GPU vs NVIDIA RTX 3500 Ada Generation Laptop GPU vs Nvidia RTX 1000 Ada Generation Laptop GPU
NVIDIA RTX A4000 Laptop GPU
► remove from comparisonDie Nvidia RTX A4000 Laptop GPU oder A4000 Mobile (für Laptops) ist eine professionelle Grafikkarte für mobile Workstations. Sie basiert auf die Consumer GeForce RTX 3070 Laptop GPU und bietet ebenfalls 5,120 Grafik-Kerne, 40 RT-Kerne, 160 Tensor-Kerne und 8 GB GDDR6 Grafikspeicher. Im Vergleich zu einer günstigeren GeForce RTX 3070 Laptop GPU mit Studio Treibern, bietet die RTX A4000 zertifizierte Treiber für zahlreiche professionelle Applikationen.
Wie auch die GeForce RTX 3070 Mobile, ist auch die RTX A4000 in verschiedenen TGP-Versionen erhältlich. Diese rangieren bei der A4000 von 80 - 140 Watt und damit im Maximum 15W höher als die RTX 3070 Mobile. Je nach verbauter Variante unterscheiden sich die Taktraten von Chip und Speicher und damit auch deutlich die Performance. Es startet bei 80W und Taktraten von 780 - 1395 MHz und endet bei 115 Watt und 1140 - 1680 MHz.
Es gibt nun keine Max-Q Variante mehr (die 80 - 90 Watt Versionen heissen auch nur "Laptop GPU"), aber jede TGP-Version kann die Max-Q Technologien nutzen (Dynamic Boost, WhisperMode).
Die professionellen Grafikkarten von Nvidia bieten zertifizierte Treiber, welche auf Stabiltität und Performance bei professionellen Anwendungen (CAD-, DCC-, Medizin-, Prospektions-, Visualisierungsanwendungen) optimiert sind.
Die Leistung ist abhängig von der TGP-Variante und der verwendeten Kühlung. Bei gleichem TGP sollte sie aber deutlich oberhalb einer alten Quadro RTX 4000 bzw. RTX 4000 Max-Q für Laptops liegen. Die Desktop-Variante der RTX A4000 sollte jedoch deutlich schneller ausfallen (durch den höheren TGP und höhere Taktraten). Dadurch reicht die Leistung bei den meisten anspruchsvollen Spielen auch für 4k mit maximalen Details.
Der GA104 Chip bietet 6.144 FP32 ALUs wovon die Hälfte auch INT32 Befehle ausführen können (also 3.072 INT32 ALUs). Bei Turing konnten noch alle Shader FP32 oder INT32 ausführen. Die Raytracing und Tensor Kerne auf dem Chip wurden laut Nvidia ebenfalls verbessert. Die RTX A4000 nutzt jedoch nur 5.120 der 6.144 Kerne. Weiters integriert der Ampere Chip einen Hardware Video-Encoder (NVENC 5. Generation für H.264 und H.265) und Decoder (7. Generation für zahlreiche Formate inklusive AV1).
Der GA104 Chip wird bei Samsung im 8nm (8N) Verfahren welches mit dem 7nm Verfahren von TSMC nicht ganz mithalten kann (z.B. von AMD genutzt, aber auch für den professionellen GA100 Ampere Chip).
NVIDIA RTX 3500 Ada Generation Laptop GPU
► remove from comparisonDie NVIDIA RTX 3500 Ada Generation Laptop GPU ist eine professionelle Grafikkarte für Notebooks. Sie basiert auf die Consumer RTX 4070 Desktop mit ebenfalls 5.120 CUDA Kernen, 40 Raytracing Kernen und 160 Tensor Kernen der 4. Generation. Beim Grafikspeicher setzt die RTX 3500 ebenfalls auf 12 GB mit einem 192-Bit Bus, jedoch unterstützt der Speicher ECC-Fehlerkorrektur (optional, reduziert die nutzbare Größe). Die Taktraten sind bei den professionellen RTX-Modellen immer etwas geringer als bei den mobilen Versionen. Dadurch sollte sich die RTX 3500 deutlich hinter der RTX 3080 Laptop GPU einreihen. Wie auch bei der RTX 4080 ist dieser jedoch abhängig vom TDP der vom Notebook zur Verfügung gestellt wird. Die RTX 3500 kann laut Nvidia von 60 bis 140 Watt (wahrscheinlich inklusive 25W Dynamic Boost) konfiguriert werden mit dementsprechend großen Performanceunterschieden.
Der eingesetzte AD104 Chip wird bei TSMC im 4N Prozess (5nm) gefertigt.
Nvidia RTX 1000 Ada Generation Laptop GPU
► remove from comparisonDie Nvidia RTX 1000 Ada Generation Laptop GPU, nicht zu verwechseln mit der A1000, P1000 oder T1000, ist eine professionelle Grafikkarte der unteren Preisklasse für den Einsatz in Laptops, die mit 2.560 CUDA-Kernen und 6 GB GDDR6 VRAM ausgestattet ist. Die GPU ist ähnlich zur Consumer GeForce RTX 4050 (Laptop). Die Grafikkarte wird von demselben AD107-Chip angetrieben und ist schnell genug, um die meisten Spiele mit 1080p bei hoher Qualität zu spielen. Das Produkt wurde im Februar 2024 auf den Markt gebracht; es nutzt den 5-nm-Prozess von TSMC und die Ada Lovelace-Architektur von Nvidia. Der von Nvidia empfohlene TGP-Bereich ist mit 35 W bis 140 W sehr breit gefächert, was zu hohen Leistungsunterschieden zwischen verschiedenen Systemen führt, die mit derselben Grafikkarte betrieben werden.
Die Grafikkarten der Quadro-Serie werden mit einem ganz anderen BIOS und anderen Treibern als die GeForce-Karten ausgeliefert und richten sich eher an professionelle Anwender als an Spieler. Kommerzielles Produktdesign, umfangreiche Berechnungen, Simulationen, Data Mining, 24x7-Betrieb, zertifizierte Treiber - wenn Ihnen das alles bekannt vorkommt, dann werden Sie mit einer Quadro-Karte glücklich.
Architektur und Funktionen
Ada Lovelace bietet eine Reihe von Verbesserungen gegenüber älteren Grafikkarten, die die bisherige Ampere-Architektur verwenden. Wir haben es hier nicht nur mit einem besseren Herstellungsverfahren und einer höheren Anzahl von CUDA Kernen zu tun, sondern auch mit einer Fülle von Verbesserungen unter der Haube, darunter ein größerer L2-Cache, eine optimierte Raytracing-Routine und andere Änderungen. Natürlich können diese Grafikkarten einige der am weitesten verbreiteten Videocodecs, darunter AVC, HEVC und AV1, sowohl kodieren als auch dekodieren; sie unterstützen auch eine Vielzahl proprietärer Nvidia-Technologien, darunter Optimus und DLSS 3, und sie können sicherlich für verschiedene KI-Anwendungen verwendet werden.
Die RTX 1000 Ada verfügt über 20 Raytracing-Kerne der 3. Generation, 80 Tensor-Kerne der 4. Generation und 2.560 CUDA-Kerne. Erhöht man diese Zahlen um 20 %, erhält man die RTX 2000 Ada - vorausgesetzt natürlich, man beachtet die Unterschiede in der Taktfrequenz nicht. Im Gegensatz zu den teureren professionellen Laptop-Grafikkarten der Ada-Generation ist die RTX 1000 mit nur 6 GB Non-ECC-VRAM ausgestattet; die fehlende Fehlerkorrektur macht diese Karte weniger geeignet für kritische Aufgaben und den Rund-um-die-Uhr-Betrieb. Der VRAM ist nur 96 Bit breit und liefert eine nicht gerade beeindruckende Bandbreite von ~192 GB/s.
Die RTX 1000 Ada Generation nutzt das PCI-Express 4 Protokoll, genau wie die Ampere-basierten Karten. 8K-SUHD-Monitore werden unterstützt, allerdings könnten sich die DP 1.4a-Videoausgänge in der Zukunft als Engpass erweisen.
Leistung
Während wir bis Ende Februar noch kein einziges Notebook mit der RTX 1000 Ada getestet haben, verfügen wir über zahlreiche Leistungsdaten für das RTX 4050 Laptop. Auf dieser Grundlage erwarten wir, dass eine RTX 2000 Ada eine durchschnittliche Leistung liefert:
- einen Blender 3.3 Classroom CUDA Score von etwa 53 Sekunden
- einen 3DMark 11 GPU-Score von rund 30.000 Punkten
- mehr als 50 fps in GTA V (1440p - höchstmögliche Einstellungen, 16x AF, 4x MSAA, FXAA)
- mehr als 35 fps in Cyberpunk 2077 (1440p - Hohe Einstellungen, Ultra RT, "Quality" DLSS)
In den Marketingunterlagen von Nvidia ist von einer Leistung von bis zu 12,1 TFLOPS" die Rede, eine Verschlechterung im Vergleich zu den 14,5 TFLOPS der RTX 2000 Ada.
Je nachdem, wie gut die Kühllösung Ihres Laptops ist und wie hoch das TGP-Leistungsziel der RTX 1000 Ada ist, können Ihre Erfahrungen davon abweichen.
Leistungsaufnahme
Nvidia unterteilt seine Laptop-Grafikkarten nicht mehr in Max-Q- und Nicht-Max-Q-Modelle. Stattdessen können die Hersteller von Laptops den TGP-Wert frei nach ihren Bedürfnissen festlegen, und die Spanne kann manchmal erschreckend groß sein. Genau das ist bei der RTX 1000 der Fall, denn der niedrigste empfohlene Wert liegt bei nur 35 W, während der höchste Wert mit 140 W um 300 % höher liegt. Das langsamste System, das mit der RTX 1000 ausgestattet ist, kann leicht halb so schnell sein wie das schnellste.
Nicht zuletzt sorgt der verbesserte 5-nm-Prozess (TSMC 4N), mit dem die RTX 1000 gebaut wird, für eine anständige Energieeffizienz (ab Anfang 2024).
NVIDIA RTX A4000 Laptop GPU | NVIDIA RTX 3500 Ada Generation Laptop GPU | Nvidia RTX 1000 Ada Generation Laptop GPU | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
RTX Ada Generation Laptop GPU Serie |
|
|
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Codename | GA104 | GN21-X2 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Architektur | Ampere | Ada Lovelace | Ada Lovelace | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Pipelines | 5120 - unified | 5120 - unified | 2560 - unified | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
TMUs | 160 | 80 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
ROPs | 80 | 32 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Raytracing Cores | 40 | 40 | 20 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Tensor / AI Cores | 160 | 160 | 80 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Kerntakt | 780 - 1680 (Boost) MHz | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Theoretical Performance | 17.8 TFLOPS FP32 | 23 TFLOPS FP32 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Cache | L2: 4 MB | L2: 12 MB | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Speichertakt | 12000 effective = 1500 MHz | 16000 effective = 2000 MHz | 16000 effective = 2000 MHz | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Speicherbandbreite | 256 Bit | 192 Bit | 96 Bit | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Speichertyp | GDDR6 | GDDR6 | GDDR6 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Max. Speichergröße | 8 GB | 12 GB | 6 GB | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Shared Memory | nein | nein | nein | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Memory Bandwidth | 384 GB/s | 432 GB/s | 192 GB/s | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
API | DirectX 12_2, Shader 6.7, OpenGL 4.6 | DirectX 12 Ultimate, Shader 6.7, OpenGL 4.6, OpenCL 3.0, Vulkan 1.3 | DirectX 12 Ultimate, Shader 6.7, OpenGL 4.6, OpenCL 3.0, Vulkan 1.3 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Stromverbrauch | 140 Watt (80 - 125 Watt TGP) | 115 Watt (60 - 115 Watt TGP) | 115 Watt (35 - 115 Watt TGP) | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Herstellungsprozess | 8 nm | 5 nm | 5 nm | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
PCIe | 4.0 | 4.0 x16 | 4.0 x16 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Displays | HDMI 2.1, DisplayPort 1.4 | 4 Displays (max.), HDMI 2.1, DisplayPort 1.4a | 4 Displays (max.), HDMI 2.1, DisplayPort 1.4a | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Features | DisplayPort 1.4, HDMI 2.1, PCIe 4.0 x16, 17.8 SP-FP TFLOPS Peak, 143 Tensor Performance Peak, up to 384 GB/s Memory Bandwidth, Resizable BAR, Support for Modern Standby | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Notebookgröße | groß (17" z.B.) | groß (17" z.B.) | groß (17" z.B.) | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Erscheinungsdatum | 12.04.2021 | 21.03.2023 | 27.02.2024 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Herstellerseite | www.nvidia.com | images.nvidia.com | images.nvidia.com | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Predecessor | RTX A3000 Laptop GPU |