NVIDIA GeForce GT 635M vs NVIDIA GeForce GT 650M SLI vs NVIDIA GeForce GT 640M LE
NVIDIA GeForce GT 635M
► remove from comparisonDie NVIDIA GeForce GT 635M ist eine Notebook-Grafikkarte der Mittelklasse und technisch gesehen eine umbenannte GeForce GT 555M. Sie besitzt je nach Modell 96 (GF108) oder 144 Shader-Einheiten (GF116) und verfügt über ein 128 beziehungsweise 192 Bit breites Speicherinterface für DDR3 und GDDR5. Als Ableger der Fermi-Architektur unterstützen alle Karten DirectX 11 und OpenGL 4.0.
Einige Varianten (der GT 555M nach Performance)
- 144 Kerne 709 MHz, 128 Bit GDDR5 z.B. MSI GX780
- 144 Kerne 590 MHz , 192 Bit DDR3 z.B. Dell XPS 17, Alienware M14x
- 144 Kerne 590 MHz , 128 Bit DDR3 z.B. Schenker XMG A501 / A701 (Clevo W150HRM / W170HN)
- 96 Kerne 753 MHz, 128 Bit GDDR5 z.B. Lenovo Y570p / Y560p
Architektur
Der GF116 Kern der GT 635M basiert auf dem GF100 (GeForce GTX 480M) und bietet maximal 192 Shader sowie einen 192 Bit Speicherbus für GDDR5. Im Vergleich zum GF114 Kern, ist der GF116 sozusagen eine halbierte Version. Dadurch ist die Architektur nicht mehr mit dem GT215 (GeForce GTS 350M) oder GT216 (GeForce GT 330M) verwandt. Im Unterschied zum GF100 wurden die kleineren GF114, GF116 und GF108 Kerne jedoch nicht nur abgespeckt, sondern deutlich abgeändert. Die Chips sind auf den Consumer Markt orientiert (GF100 für professionelle Anwendungen) und besitzen mehr Shader (3x16 statt 2x16), Textureinheiten (8 statt 4) und SFUs (Special-Funciton-Units) pro Streaming-Multiprocessors (SM). Da sich jedoch immer noch nur zwei Warp Scheduler um die drei Shader Blöcke kümmern, stieg Nvidia auf eine Superskalare Architektur um. Dadurch kann man die Shader theoretisch besser auslasten und die Performance pro Rechenkern steigern. Im Worst-Case kann die Performance allerdings auch schlechter als bei der GF100 Architektur (und den Vorgängern) sein. Der für professionelle Anwendungen wichtige ECC Speicherschutz wurde komplett weggelassen und die FP64 Hardware beschnitten (nur noch 1/3 der Shader sind FP64 fähig und damit 1/12 der FP32 Leistung). Durch die Beschneidungen im Vergleich zum GF100 stieg die Größe eines SM lediglich um 25% trotz der höheren Shaderanzahl. Aufgrund der unterschiedlichen Shaderarchitekturen und der höheren Taktung der Rechenkerne bei Nvidia, kann man die Anzahl nicht direkt mit den AMD Radeon Grafikkarten (z.B. HD 5730) vergleichen.
Detaillierte Informationen zur GF104 (und damit auch GF106 und GF108) Architektur kann man beispielsweise bei Anandtech nachlesen (über die Desktop GTX 460 - Englisch).
Mit der GF114 und GF116 wurden die Vorgänger GF104 / GF106 leicht überarbeitet. Durch ein geändertes Transistordesign war es Nvidia möglich, die Taktraten der Chips zu steigern, bei gleichzeitiger Absenkung der Leistungsaufnahme. Die resultierende Steigerung der Leistung pro Watt ist insbesondere für die Notebook-Chips bedeutsam.
Leistung
In Abhängigkeit von der Shader-Zahl, den Taktraten sowie der Speicheranbindung liegt die Performance der GT 635M in etwa auf dem Niveau des Vorgängers GT 555M und knapp unterhalb des Kepler-Modelles GT 640M. Die schnellsten Version mit 144 Shader-Einheiten bei 675 MHz sowie GDDR5-VRAM erzielen im 3DMark 11 (Performance-Preset) einen GPU-Score von etwa 1400 bis 1500 Punkten. Bei geringeren Taktraten sowie DDR3-Speicher sind die Ergebnisse etwas niedriger. Innerhalb der GeForce 600M Serie nimmt die GT 635M damit eine mittlere Position ein. Aktuelle Spiele (2012) können im Schnitt mit mittleren Details in einer Auflösung von 1366x768 Pixeln flüssig dargestellt werden.
Features
Eine weitere Neuheit bei den GF1x4/1x6/108 Chips ist die Unterstützung der Bitstream Übertragung von HD Audio (Blu-Ray) per HDMI Anschluss. Wie die Radeon HD 5850, kann die GTX 460M Dolby True HD und DTS-HD per Bitstream ohne Qualitätsverlust an einen geeigneten Receiver übertragen.
Zur Dekodierung von HD Videos durch die Grafikkarte unterstützt die GT635M PureVideo HD. Der verbaute Video Processor 4 (VP4) beherrscht das Feature Set C und kann somit MPEG-1, MPEG-2, MPEG-4 Part 2 (MPEG-4 ASP - z.B. DivX oder Xvid), VC-1/WMV9 und H.264 vollständig auf der Grafikkarte dekodieren (VLD, IDCT, Motion Compensation und Deblocking).
Des Weiteren können gleichzeitig zwei Streams in Echtzeit dekodiert werden um beispielsweise Blu-Ray Picture-in-Picture umzusetzen (2x1080p lt DXVAChecker). Außerdem bezeichnet PureVideo HD die Fähigkeit der HDCP Verschlüsselung für digitale Anschlüsse.
Für generelle Berechnungen (z.B. Video Transcoding) können die Shader Cores (auch CUDA Cores genannt) durch die Schnittstellen CUDA, DirectCompute 2.1 und OpenCL angesprochen werden. Dank PhysX kann die 635M Physikberechnungen zudem auf die GPU verlagern.
Eine Neuheit ist laut Nvidia auch die Unterstützung für 3D Vision inklusive Support für HDMI 1.4a (nicht in Verbindung mit Optimus). Somit kann man (sofern vom Notebookhersteller unterstützt) 3D Spiele, 3D Web Streaming Videos, 3D Fotos und 3D Blu-Ray Videos auf einem 3D Fernseher (per separatem 3DTV Play) oder am internen 3D Display wiedergeben.
Der Stromverbrauch der GeForce GT 635M dürfte für 15-17" Notebooks ausgelegt sein. Um Strom zu sparen unterstützt der GF106 Optimus zum automatischen Umschalten zwischen integrierter Grafikeinheit und Nvidia GPU. Dies muss jedoch vom Notebookhersteller umgesetzt werden und kann nicht nachgerüstet werden.
NVIDIA GeForce GT 650M SLI
► remove from comparisonDie NVIDIA GeForce GT 650M SLI ist eine DirectX 11 Grafiklösung, welche aus einem Verbund zweier GeForce GT 650M Grafikkarten besteht. Diese beruhen auf den in 28nm gefertigten GK107 Kepler Chip und kommen bis jetzt nur im Lenovo Y500 zum Einsatz. Dort wird die Version mit schnellem GDDR5 Grafikspeicher und Taktraten von 790 bis 835 (GeForce Boost) verbaut.
Normalerweise rendern sie je ein Bild abwechselnd wodurch es zu ungleichmäßigen Abständen zwischen den Frames und dadurch Microrucklern kommen kann. Ausserdem kann man den Grafikspeicher beider Karten nicht zusammenrechnen, da jede Grafikkarte den selben Speicherinhalt vorrätig halten muss.
Architektur
Mit Kepler löst Nvidia die bisherige Fermi-Architektur ab, die unter anderem bei verschiedenen Chips und Modellen der GeForce-500M-Serie zum Einsatz kam. Der GK107 verfügt als derzeit kleinster Kepler-Chip über 2 Shader-Blöcke, die vom Hersteller mit dem Kürzel SMX bezeichnet werden. Zusammen mit zwei Polymorph Engines und einer gemeinsamen Raster Engine bilden diese einen sogenannten GPC (Graphics Processing Cluster). Da die Shader keine eigene Takt-Domain mehr besitzen (Hot Clock), entspricht die Rechenleistung der 384 ALUs in etwa 192 Einheiten der Fermi-Architektur mit doppelter Taktrate. Diese Änderung ist einer der Gründe dafür, dass sich laut Nvidia die Energieeffizienz gegenüber dem Vorgänger verdoppelt hat. Auch die Tesselations-Leistung soll, speziell bei hohen Faktoren, noch einmal deutlich verbessert worden sein. Als zusätzliche Neuerungen werden zudem erstmals PCIe 3.0 sowie ein noch nicht näher bezeichneter, optionaler Turbo-Modus unterstützt. Dieser kann, ausreichende Kühlungsreserven vorausgesetzt, die Kerntaktrate um bis zu 15 Prozent anheben. Da der Turbo vom BIOS gesteuert wird, steht er, falls vom Notebook-Hersteller implementiert, unabhängig vom Betriebssystem zur Verfügung.
Leistung
Die Performance der GeForce GT 650M SLI ist stark abhängig wie gut SLI vom Spiel und Treiber unterstützt wird. Im synthetischen 3DMark 11 erreicht die Kombination ihr theoretisches Maximum, welches sogar oberhalb einer einzelnen GeForce GTX 670MX liegt. Das untere Minimum ist eine einzelne GeForce GT 650M, falls SLI nicht unterstützt wird. Wie unsere Gaming-Benchmarks belegen, ordnet sich das SLI-Gespann insgesamt zwischen der GeForce GTX 670MX und der GeForce GTX 675MX ein.
Features
Das aktualisierte Featureset umfasst nun die Unterstützung von bis zu 4 aktiven Displays (mit Optimus u.U. weniger), die mit einer maximalen Auflösung von 3840 x 2160 Pixeln zum Beispiel über DisplayPort 1.2 oder HDMI 1.4a angebunden werden können. HD-Audio-Formate wie Dolby True HD und DTS-HD lassen sich als Bitstream an einen geeigneten Receiver senden. Wie in der Vergangenheit kann jedoch auch weiterhin 3D Vision nicht mit Optimus-Unterstützung kombiniert werden.
Der PureVideo HD Videoprozessor der fünften Generation (VP5) wurde vom GF119-Chip übernommen. Dieser kann die Formate MPEG-1, MPEG-2, MPEG-4, H.264 und VC1/WMV9 bis zu einer Auflösung von 4k decodieren und somit den Prozessor entlasten. Auch zwei parallele Streams, beispielsweise für Picture-in-Picture bei einer Blu-Ray, sind möglich. Eine weitere Neuerung ist die Integration eines dedizierten Videoencoders ähnlich Intels Quick Sync, der über die NVENC-API angesprochen werden kann.
Die Leistungsaufnahme der GeForce GT 650M SLI liegt ist unter Last bis zu doppelt so hoch wie eine einzelne GT 650M. Dadurch eignet sich der Verbund nur für große und schwere Notebooks. Optimus wird derzeit von SLI Kombinationen nicht unterstützt.
NVIDIA GeForce GT 640M LE
► remove from comparisonDie NVIDIA GeForce GT 640M LE ist eine DirectX 11.1 Mittelklasse Grafikkarte für thin-and-light-Notebooks, welche im 1. Quartal 2012 vorgestellt wurde. Sie basiert auf dem GK107 Chip der Kepler-Serie und wird in 28nm bei TSMC hergestellt. Die LE-Variante unterscheidet sich von der normalen GT 640M durch eine deutlich geringere Kerntaktrate von lediglich 500 MHz. Achtung: Gerüchten zufolge soll es auch Fermi-basierte und somit in 40nm gefertigte Modelle geben, deren technische Daten (96 Shader-ALUs, 762 MHz Kerntaktrate, DDR3/GDDR5) auf eine umbenannte und nur leicht modifizierte GT 550M/555M deuten. Die Leistungsaufnahme dieser Version dürfte jedoch deutlich höher sein. Nachfolgend beziehen wir uns auf die Variante mit Kepler/GK107-Chip.
Architektur
Mit Kepler löst Nvidia die bisherige Fermi-Architektur ab, die unter anderem bei verschiedenen Chips und Modellen der GeForce-500M-Serie zum Einsatz kam. Der GK107 verfügt als derzeit kleinster Kepler-Chip über 2 Shader-Blöcke, die vom Hersteller mit dem Kürzel SMX bezeichnet werden. Zusammen mit zwei Polymorph Engines und einer gemeinsamen Raster Engine bilden diese einen sogenannten GPC (Graphics Processing Cluster). Da die Shader keine eigene Takt-Domain mehr besitzen (Hot Clock), entspricht die Rechenleistung der 384 ALUs in etwa 192 Einheiten der Fermi-Architektur mit doppelter Taktrate. Diese Änderung ist einer der Gründe dafür, dass sich laut Nvidia die Energieeffizienz gegenüber dem Vorgänger verdoppelt hat. Auch die Tesselations-Leistung soll, speziell bei hohen Faktoren, noch einmal deutlich verbessert worden sein. Als zusätzliche Neuerungen werden zudem erstmals PCIe 3.0 sowie ein noch nicht näher bezeichneter, optionaler Turbo-Modus unterstützt. Dieser kann, ausreichende Kühlungsreserven vorausgesetzt, die Kerntaktrate um bis zu 15 Prozent anheben. Da der Turbo vom BIOS gesteuert wird, steht er, falls vom Notebook-Hersteller implementiert, unabhängig vom Betriebssystem zur Verfügung.
Leistung
Die Performance der GeForce GT 640M LE liegt durch die geringe Taktrate von nur 500 MHz etwa 20 Prozent unterhalb der GT 640M, dies entspricht etwa dem Niveau der GT 635M beziehungsweise GT 555M. Besonders gut präsentiert sich der Chip in Shader-lastigen DirectX-11-Benchmarks wie dem 3DMark 11, etwas schwächer ist die Leistung, wenn das vergleichsweise schmale Speicherinterface (128 Bit DDR3) stark gefordert wird. Varianten mit GDDR5-Speicher können in diesen Fällen deutlich schneller sein. Anspruchsvolle aktuelle Spiele sind in mittleren Einstellungen meist flüssig darstellbar (Stand Frühjahr 2012).
Features
Das aktualisierte Featureset umfasst nun die Unterstützung von bis zu 4 aktiven Displays (mit Optimus u.U. weniger), die mit einer maximalen Auflösung von 3840 x 2160 Pixeln zum Beispiel über DisplayPort 1.2 oder HDMI 1.4a angebunden werden können. HD-Audio-Formate wie Dolby True HD und DTS-HD lassen sich als Bitstream an einen geeigneten Receiver senden. Wie in der Vergangenheit kann jedoch auch weiterhin 3D Vision nicht mit Optimus-Unterstützung kombiniert werden.
Der PureVideo HD Videoprozessor der fünften Generation (VP5) wurde vom GF119-Chip übernommen. Dieser kann die Formate MPEG-1, MPEG-2, MPEG-4, H.264 und VC1/WMV9 bis zu einer Auflösung von 4k decodieren und somit den Prozessor entlasten. Auch zwei parallele Streams, beispielsweise für Picture-in-Picture bei einer Blu-Ray, sind möglich. Eine weitere Neuerung ist die Integration eines dedizierten Videoencoders ähnlich Intels Quick Sync, der über die NVENC-API angesprochen werden kann.
Die Leistungsaufnahme der GeForce GT 640M LE liegt etwa im Bereich der GT 520M, womit sich die Grafikkarte kleinere oder besonders dünne Notebooks eignet. Bei geringer Last helfen zusätzliche Taktstufen dabei, Energie einzusparen, im Leerlauf kann die GPU mit Hilfe der Optimus-Technologie zugunsten eines IGP auch vollständig deaktiviert werden.
NVIDIA GeForce GT 635M | NVIDIA GeForce GT 650M SLI | NVIDIA GeForce GT 640M LE | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
GeForce GT 600M Serie |
|
|
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Codename | N13E-GE2 | N13E-GE | N13P-LP | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Architektur | Fermi | Kepler | Fermi / Kepler | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Pipelines | 144 - unified | 768 - unified | 384 - unified | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Kerntakt | 660 - 753 (Boost) MHz | 790 - 835 (Boost) MHz | 500 MHz | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Shadertakt | 1320-1505 MHz | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Speichertakt | 1800 MHz | 4000 MHz | 1800 - 4000 MHz | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Speicherbandbreite | 128/192 Bit | 2x 128 Bit | 128 Bit | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Speichertyp | DDR3, GDDR5 | GDDR5 | DDR3, GDDR5 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Max. Speichergröße | 2048 MB | 2x2048 MB | 2048 MB | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Shared Memory | nein | nein | nein | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
API | DirectX 11, Shader 5.0 | DirectX 11, Shader 5.0 | DirectX 11, Shader 5.0 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Herstellungsprozess | 40 nm | 28 nm | 28 nm | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Notebookgröße | groß (17" z.B.) | mittel (15.4" z.B.) | mittel (15.4" z.B.) | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Erscheinungsdatum | 06.12.2011 | 22.03.2012 | 22.03.2012 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Features | Optimus, PhysX, Verde Drivers, CUDA, 3D Vision, 3DTV Play | Optimus, PhysX, Verde Drivers, CUDA, 3D Vision, 3DTV Play |