Kurztest: Performance-Übersicht und Skalierung der Intel HD Graphics 4000
Beim Thema Grafikkarten denken viele zunächst an AMD oder Nvidia - die bekanntesten und schnellsten Modelle am Markt stammen schließlich von diesen beiden Unternehmen. Was allerdings nicht jeder weiß: Geht es nur nach den Stückzahlen, beherrschen vor allem integrierte Grafiklösungen und damit der Chip-Riese Intel die Statistiken.
Die modernste und leistungsfähigste IGP des Herstellers ist dabei die HD Graphics 4000, enthalten in den meisten Prozessoren der Ivy Bridge-Generation. Auch wenn Intel im Grafiksektor noch immer ein gutes Stück hinter den APUs von AMD liegt, hat man mit der HD 4000 zumindest einen großen Schritt nach vorne gemacht, wie wir bereits in unserem Benchmark-Artikel herausfinden konnten.
Heute wollen wir uns weniger dem Vergleich mit der Konkurrenz, als viel mehr einem allgemeinen Blick auf die verschiedenen HD-4000-Ableger widmen. Unterschiedliche Taktraten, Cache-Größen und Speicherbestückungen können die Performance entscheidend beeinflussen - wie stark genau, soll nun geklärt werden.
Wir erweitern unser Team und suchen Gaming-Enthusiasten sowie Unterstützung für unsere Video-Produktion im Raum Hamburg.
Details
Übersicht
Jede HD 4000 verfügt über 16 sogenannte Execution Units (EUs), deren Taktrate bei entweder 350 (ULV) oder 650 MHz liegt. In 3D-Anwendungen kann die GPU einen zusätzlichen Turbo Boost zünden, der die Frequenz um mehrere hundert MHz anhebt. Dieser Turbo wird zwar durch die Chiptemperatur sowie die Leistungsaufnahme determiniert, liegt im Regelfall aber nahezu konstant an - bei besonders hoher Auslastung wird, falls notwendig, zuerst der CPU-Turbo eingeschränkt. Bei den derzeit verfügbaren Modellen liegt der maximale GPU-Turbo zwischen 1.000 (Core i3-3110M) und 1.350 MHz (Core i7-3940XM).
Obwohl Intel der Grafikeinheit einen eigenen L3-Cache (256 KByte) spendiert hat, kann die HD 4000 auch den großen L3-Cache der CPU mitbenutzen. Korrekterweise müsste dieser als "Last Level Cache" (LLC) bezeichnet werden, wir wollen uns nachfolgend aber an das gebräuchlichere Namensschema halten. Bei den Dual-Core-Modellen ist dieser entweder 3 oder 4 MByte, bei den Quad-Cores 6 oder 8 MByte groß und dient dazu die vergleichsweise langsamen Zugriffe auf den Hauptspeicher zu reduzieren.
Die Speicheranbindung ist seit jeher einer der größten Flaschenhälse jeder integrierten Grafikkarte. Während dedizierten High-End-GPUs in der Regel schneller GDDR5-VRAM an einem mindestens 256 Bit breiten Interface zur Verfügung steht, muss die HD 4000 mit dem deutlich langsameren Arbeitsspeicher vorliebnehmen. Im Klartext heißt das: Maximal zwei 64-Bit-Kanäle mit 800 MHz Bustaktrate (DDR3-1600), die sich die GPU zudem mit dem Prozessor teilt. Überdies werden manche Notebooks nur mit einem Speicherriegel und/oder langsameren Modulen ausgestattet, was die Bandbreite zusätzlich mindert.
Das Testsystem
Für unsere Messungen haben wir dasselbe Testsystem genutzt, welches auch bei unserem jüngsten CPU-Artikel zum Einsatz kam. Als Notebook diente dabei das One M73-2N (MSI MS-1762 Barebone), welches dank seines leistungsfähigen Kühlsystemes das volle Ausschöpfen des Turbo-Boost-Spielraumes erlaubt.
Um die Messwerte nicht durch Nachladeruckler zu verfälschen, verwendeten wir eine flotte Samsung-SSD mit 128 GByte Speicherplatz sowie 8 GByte DDR3-RAM. Lediglich der Bandbreitentest wurde zum Teil nur mit 4 GByte durchgeführt, was in diesem Fall jedoch keine negativen Auswirkungen auf die Performance hatte.
Testkonfiguration:
- Intel Ivy-Bridge-CPUs
- HD Graphics 4000 (8.15.10.2761)
- Intel HM77 Chipsatz
- 2x 4 GByte Samsung DDR3-1600 (CL11)
- 1x 4 GByte Kingston DDR3-1333 (CL9)
- Samsung PM830 SSD (128 GByte)
- 180-Watt-Netzteil
- Windows 7 Professional 64 Bit
Bezeichnung | Kerne/Threads | CPU-Taktrate | L3-Cache | TDP | GPU-Taktrate |
---|---|---|---|---|---|
Core i7-3940XM | 4/8 | 3.0 - 3.9 GHz | 8 MB | 55 W | 650-1350 MHz |
Core i7-3840QM | 4/8 | 2.8 - 3.8 GHz | 8 MB | 45 W | 650-1300 MHz |
Core i7-3740QM | 4/8 | 2.7 - 3.7 GHz | 6 MB | 45 W | 650-1300 MHz |
Core i7-3630QM | 4/8 | 2.4 - 3.4 GHz | 6 MB | 45 W | 650-1150 MHz |
Core i7-3610QM | 4/8 | 2.3 - 3.3 GHz | 6 MB | 45 W | 650-1100 MHz |
Core i5-3210M | 2/4 | 2.5 - 3.1 GHz | 3 MB | 35 W | 650-1100 MHz |
Benchmarks
Prinzipbedingt ließen sich bei den nachfolgenden Benchmarks zwei unerwünschte Einflussfaktoren nicht vermeiden. Zum einen betrifft dies die Prozessorleistung, welche zwischen den einzelnen CPUs teils spürbar variiert. Allerdings dürfte dies durch die starke GPU-Limitierung der gewählten Programme nur einen untergeordneten Einfluss auf die Performance haben. Ebensowenig konnten wir unterschiedliche L3-Taktraten verhindern, da selbige an den Prozessortakt gekoppelt sind. Besonders schwerwiegend dürfte aber auch diese Fehlerquelle nicht sein.
3DMark Vantage
Immerhin 28 Prozent trennen die schnellste HD-4000-Ausbaustufe im 3DMark Vantage (GPU-Score) von der langsamsten - 5 Prozent mehr, als die reine Taktdifferenz beträgt. Der Einfluss der L3-Cache-Größe ist somit relativ gering: Etwa 5 Prozent liegen zwischen 3 und 6 MByte, weitere 2 MByte steigern die Leistung nur um zusätzlich 2 Prozent.
3DMark 11
Der 3DMark 11 reagiert dagegen deutlich sensibler auf die Größe des Zwischenspeichers. Mit knapp 9 Prozent (3 zu 6 MByte) beziehungsweise 3 Prozent (6 zu 8 MByte) ist der L3-Cache kein unbedeutender Leistungsfaktor. Ebenfalls interessant: Taktsteigerungen werden bei gleicher Cachegröße nahezu linear in Mehrleistung umgewandelt. Dies deutet darauf hin, dass die Speicherbandbreite - zumindest bei DDR3-1600 im Dual-Channel-Modus - kaum limitiert.
Deus Ex: Human Revolution
Um die Erkenntnisse der synthetischen 3DMark-Tests auch in einem realen 3D-Spiel zu verifizieren, haben wir das Action-RPG Deus Ex: Human Revolution herangezogen. Dieses liefert besonders konstante Frameraten und eignet sich somit perfekt für unsere Benchmarks, in denen es um Differenzen im Bereich weniger Prozente geht.
Insgesamt ähneln die Ergebnisse in etwa denen des 3DMark 11. Vor allem der Schritt von 3 auf 6 MByte L3-Cache sowie die Taktrate bestimmen die Performance.
Speicherskalierung
Alle bisherigen Messungen wurden mit der schnellstmöglichen Speicherkonfiguration durchgeführt - doch was passiert, wenn der Notebookhersteller eine weniger optimale Bestückung gewählt hat? Da vor allem günstige Geräte teils nur mit einem Speichermodul oder langsamerem DDR3-1333 ausgeliefert werden, haben wir genau diese beiden Fälle mit dem langsamsten Modell unseres Tests, dem Core i5-3210M, untersucht.
Die Performanceeinbußen durch eine verminderte Speicherbandbreite sind dabei recht drastisch: Während Deus Ex mit DDR3-1600 im Dual-Channel-Modus bei knapp 29 fps noch recht gut spielbar ist, fällt die Framerate mit DDR3-1333 im Single-Channel-Betrieb auf stark ruckelnde 19 fps ab.
Die 20 Prozent höhere Bandbreite von DDR3-1600 zu DDR3-1333 (beide Single-Channel) resultiert in einer gut 11 Prozent höheren Performance, eine weitere Verdopplung durch ein zweites Speichermodul steigert die Leistung um immerhin 34 Prozent.
Fazit
Wie schnell ist die Intel HD Graphics 4000? Diese häufig gestellte Frage lässt sich, das hat unser kurzer Test eindeutig gezeigt, nicht wirklich pauschal beantworten.
Der wichtigste Einflussfaktor auf die Performance ist dabei die Speicheranbindung. Nur mit einem schnellem Dual-Channel-Verbund lässt sich die maximale Performance herauskitzeln, was leider bei manchen Ultrabooks mit nur einem DIMM-Slot nicht immer möglich ist.
Etwas geringer, aber dennoch nicht unbedeutend, sind die Auswirkungen von Taktrate und L3-Cache. Wer einen Core i7-3840QM oder 3940XM ohne dedizierte Grafikkarte betreibt - in der Praxis ein vermutlich recht seltener Fall - darf sich über eine spürbar höhere 3D-Leistung als bei einem Core-i3- oder Core-i5-Prozessor freuen. Im Optimalfall tastet sich die HD 4000 damit sogar an den ein oder anderen dedizierten Beschleuniger heran, auch wenn das absolute Performance-Niveau weiterhin sehr niedrig bleibt.
Mit besonderer Spannung blicken wir in die Zukunft, die mit "Kaveri" bei AMD und "Haswell" bei Intel eine weitere Leistungsexplosion bei integrierten Grafiklösungen verspricht. Der Einfluss zusätzlicher Caches und schneller Speicherlösungen dürfte bei diesen Chips vermutlich noch größer ausfallen.
Abschließend nochmals unser Dank an die Firma One, die uns diesen Test ermöglicht hat. Unter diesem Link können Sie das M73-2N konfigurieren und bestellen.