Im Test: Intel Haswell Prozessoren
Sinkende Absatzzahlen – dieses Schreckgespenst war in der CPU-Branche viele Jahre lang praktisch unbekannt. Das hat sich allerdings geändert: Neben den jüngsten wirtschaftlichen Verwerfungen, insbesondere im Euro-Raum, sorgt auch das rasante Wachstum mobiler ARM-Geräte dafür, dass der x86-Markt derzeit stark rückläufig ist. Auch Marktführer Intel bleibt von dieser Entwicklung nicht verschont und musste im ersten Quartal 2013 einen spürbaren Gewinnrückgang verbuchen. Doch das Unternehmen blickt nach vorn: Neue Produkte sollen die Nachfrage ankurbeln und dafür sorgen, dass der Vorsprung auf den Dauerkonkurrenten AMD gewahrt bleibt.
Für die am heutigen Tage vorgestellte Haswell-Architektur hat sich Intel so einiges vorgenommen: "The PC Re-Invented", so titelt die Marketing-Abteilung eurphorisch. Im Mittelpunkt steht dabei der Trend zu immer dünneren und vielseitigeren Geräten – Touch-Notebooks, Tablets, Convertibles und natürlich Ultrabooks. Aus diesem Grund wurde bei Haswell nicht nur auf die Steigerung der CPU-Performance, sondern auch eine verbesserte Energieeffizienz sowie die Leistungsfähigkeit der integrierten Grafiklösung Wert gelegt.
Wir wollen in diesem Artikel zunächst einen kurzen Blick auf die technischen Neuerungen werfen, um im Anschluss die fünf Quad-Core-Modelle Core i7-4702MQ, i7-4700MQ, i7-4800MQ, i7-4900MQ sowie i7-4930MX einer Reihe von Benchmarks zu unterziehen. Die Leistung der integrierten HD Graphics 4600 präsentieren wir Ihnen in einem gesonderten Artikel:
Aufbau
Vor unserer Detailanalyse von CPU und GPU wollen wir zunächst den Aufbau des gesamten Chips betrachten. Der Die-Shot Haswells lässt vier grundlegende Bestandteile erkennen: Prozessor, Grafikeinheit, L3-/LLC-Cache sowie den System Agent (enthält Speicher- und Displaycontroller, DMI und weitere I/O). All diese Komponenten werden von dem mit Sandy Bridge eingeführten, 256 Bit breiten Ringbus verbunden. Ein erstaunliches Detail: Trotz umfassenderer Verbesserungen wächst die Größe des Quad-Core-Dies mit GT2-GPU nur unwesentlich von 160 (Ivy Bridge) auf 177 mm² (Haswell), während die Transistorzahl mit rund 1,4 Milliarden sogar annähernd konstant bleibt. (Ergänzung: Es handelt sich hierbei um die schematische Transistorzahl; diese lag bei Ivy Bridge bei 1,2 Milliarden. Tatsächlich besitzt Haswell jedoch mit 1,6 Milliarden knapp 15 Prozent mehr Transistoren.) Zu anderen Versionen, die zukünftig noch erscheinen dürften (Quad-Core mit GT3-GPU, Dual-Core mit GT2-/GT3-GPU, native GT1-Varianten?), sind bislang noch keine entsprechenden Angaben bekannt.
Nachfolgend nun die technischen Daten des Quad-Cores mit GT2-Grafik:
- 22 Nanometer Tri-Gate-Prozess
- 1,4 Milliarden Transistoren
- 177 mm² Die-Size
- 32 + 32 KByte L1-Cache für Daten und Instruktionen (pro Kern)
- 256 KByte L2-Cache (pro Kern)
- bis zu 8 MByte L3-Cache (geteilt zwischen CPU und GPU)
- MMX, SSE bis 4.2, AVX, AVX2, FMA3, AES-NI, Intel 64
- HD-4600-Grafikeinheit (GT2, DirectX-11.1-fähig, 20 EUs)
- DDR3(L)-Speichercontroller bis 800 MHz (DDR3-1600)
- 16 Lanes nach PCIe 3.0
- TDP von 37, 47 oder 57 Watt
Über das bekannte DMI (Direct Media Interface) ist der Prozessor mit dem Chipsatz verbunden, der bei Haswell unter dem Codenamen "Lynx Point" läuft. Größte Neuerung ist hier die Umstellungen auf einen fortschrittlichen 32-Nanometer-Prozess, der gegenüber der 65-Nanometer-Fertigung bei "Panther Point" (Ivy-Bridge-Chipsätze) eine erheblich niedrigere Leistungsaufnahme verspricht. Für Notebooks dürften zunächst die Modelle HM86, HM87 sowie die Business-Version QM87 erscheinen. Genaue Spezifikationen der einzelnen Versionen können wir derzeit leider noch nicht nennen; mit bis zu 6x USB 3.0 und 6x SATA-III (Panther Point: 4x USB 3.0, 2x SATA-III) hat Intel aber auch hier einige Verbesserungen integriert.
CPU-Teil
Seit dem Jahr 2007 folgt Intels Entwicklungsabteilung dem sogenannten "Tick-Tock"-Schema: Im jährlichen Rhythmus – kleinere Verzögerungen wollen wir hier vernachlässigen – stellt das Unternehmen abwechselnd eine neue Mikroarchitektur beziehungsweise einen neuen Fertigungsprozess vor. So repräsentierte Ivy Bridge ("Tick") einen leicht modifizierten Die-Shrink der Sandy-Bridge-Generation auf eine kleinere Strukturbreite, während Haswell ("Tock") eine neue Architektur im identischen 22-Nanometer-Prozess darstellt.
Das Adjektiv "neu" sollte man dabei nicht überbewerten: Auch Haswell erfindet das Rad nicht gänzlich neu, sondern orientiert sich in vielen Punkten an seinem Vorgänger. Dennoch gibt es einige bedeutende Veränderungen: Dazu zählen beispielsweise zusätzliche Befehlssatzerweiterungen wie AVX2 und FMA3, BMI (Bit Manipulation Instructions) und TSX (Transactional Synchronization Extensions). Während AVX2 stark vereinfacht als eine Art Integer-Erweiterung der ersten AVX-Generation angesehen werden kann, ergänzt FMA3 eine Reihe neuer Instruktionen für Floating-Point-Code mit 128- und 256-Bit-Operanden. Dabei gilt es zu beachten, dass FMA3 nicht direkt kompatibel zu FMA4 ist, welches bereits von einigen aktuellen AMD-Prozessoren (Trinity, Richland) zusätzlich zu FMA3 unterstützt wird. Der entscheidende Unterschied liegt in der Verwendung der Register: FMA4 erlaubt FMA-Operationen wie "a + (b * c) = d", während bei FMA3 das Zielregister "d" einem der drei Register "a", "b" oder "c" entsprechen muss. Die beiden anderen Erweiterungen zahlen sich unter anderem in Kryptographie-Anwendungen aus (BMI) beziehungsweise optimieren die Synchronisation zwischen parallel arbeitenden Threads (TSX).
Beim Blick auf die weiterhin 14- bis 19-stufige Pipeline (die genaue Länge hängt von der Trefferquote des µOP-Caches ab) offenbart, dass Intel diese nur zum Teil überarbeitet hat. Kaum angetastet haben die Ingenieure das Front-End, wo lediglich der Prefetcher verbessert sowie die Sprungvorhersage weiter optimiert wurde. Deutlich umfangreicher sind dagegen die Modifikationen am Back-End: Größere Buffer wie ein von 168 auf 192 µOPs aufgebohrter ROB (Reorder Buffer, auch OoO-Window genannt) erhöhen die Flexibilität und Effektivität des Out-of-Order-Schedulings, zudem steigt die Zahl der (ebenfalls modifizierten) Ausführungseinheiten von 6 auf 8. Speziell in diesem Punkt unterscheidet sich Haswell drastisch von seinen Vorgängern – alle "Core"-Architekturen seit Conroe, besser bekannt als die erste Generation des Core 2 Duo, konnten lediglich 6 µOPs parallel ausführen. Auszahlen dürfte sich diese Änderung vor allem unter Verwendung von SMT – ein einzelner Thread wird nur selten alle zur Verfügung stehenden Einheiten auslasten können.
Ein derartig breites Design will natürlich auch gefüttert werden. Ohne eine ausreichend schnelle Versorgung mit Daten entstehen Lücken in der Pipeline und der Durchsatz sinkt. Um hier keinen Flaschenhals zu provozieren, hat Intel nicht nur die Größe des L2 TLB verdoppelt, sondern auch die Anbindung der L1- und L2-Caches verbreitert – und zwar ebenfalls um den Faktor zwei. Auch die Bandbreite der einzelnen, zwischen allen Kernen geteilten Abschnitte des L3-Caches (LLC) wurde durch zwei dedizierte Pipelines für Daten und sonstige Zugriffe gesteigert. Gleichzeitig wächst die Flexibilität: War der LLC bei Ivy Bridge noch in der gleichen Clock Domain wie die CPU-Kerne, lässt er sich bei Haswell nun vollkommen unabhängig takten. Dies ist insbesondere in Grafikanwendungen hilfreich: Bei hoher GPU-, aber geringer CPU-Last können die Prozessorkerne nun mit niedriger Frequenz laufen und damit Strom sparen, während der Grafikeinheit dennoch die volle Geschwindigkeit des Caches zur Verfügung steht.
Insgesamt versprechen die mit Haswell vorgenommenen Änderungen durchaus nennenswerte Performancesteigerungen, die sich nicht nur in zukünftiger Software mit Unterstützung der neuen Befehlssatzerweiterungen, sondern zum Teil auch in bestehenden Anwendungen zeigen sollten. Gleichzeitig steigt die Energieeffizienz: Nicht benötigte Chipteile werden durch ein noch feiner differenziertes Power Gating von der Stromversorgung getrennt. Weiterhin sinkt die Umschaltzeit zwischen verschiedenen Power-States (darunter ein neuer, extrem sparsamer S0ix-Modus für die ULV-Modelle) um rund 25 Prozent.
GPU-Teil
Einen wirklich grundlegenden Umbau der GPU hat sich Intel für den Haswell Nachfolger Broadwell aufgehoben. Dessen ungeachtet übertrifft der Sprung der Grafikleistung die Zuwächse bei der CPU-Performance bei weitem.
Entscheidend dafür ist vor allem eine deutliche Steigerung der Anzahl der von Intel als "Execution Units" (EUs) bezeichneten Shadereinheiten. Statt 6 (GT1) oder 16 EUs (GT2) wie bei Ivy Bridge integriert die Haswell GPU 10 (GT1), 20 (GT2) oder gar 40 (GT3) EUs. Für alle Ausbaustufen identisch ist dabei das leicht überarbeitete Front-End, welches zum Beispiel den neu eingeführten Resource Streamer (Teil des Command Streamers, reduziert den Treiber-Overhead), aber auch bekannte Teile wie den Tessellator umfasst. Diese und andere Fixed-Function-Einheiten sollen im Vergleich zum Vorgänger die doppelte Leistungsfähigkeit besitzen.
Daran schließen sich die eigentlichen Ausführungseinheiten an, welche in skalierbare Slices ("Scheiben") unterteilt sind. Ein Slice umfasst dabei den GPU-eigenen L3-Cache, das Pixel-Back-End sowie den Rasterizer. Hinzu kommen ein (GT1) oder zwei (GT2) sogenannte Sub-Slices, die unter anderem jeweils 10 EUs, die Befehlsspeicher sowie einen stark überarbeiteten Textur-Sampler mit vierfacher Durchsatzrate gegenüber Ivy Bridge enthalten. Im Falle der GT3-GPU werden zwei Slices und vier Sub-Slices verbaut, woraus sich folglich die bereits erwähnte Gesamtzahl von 40 Shadereinheiten respektive EUs ergibt.
Die maximale Ausbaustufe der Grafikeinheit (GT3e) bekommt obendrein einen zusätzlichen, 128 MByte großen eDRAM-Cache spendiert, der direkt neben dem Chip auf dem gleichen Package platziert wird. Dank einer extrem breiten 512-Bit-Anbindung – der normale Arbeitsspeicher wird nur über zwei 64-Bit-Kanäle angesprochen – steht der GPU so eine durchaus stattliche Bandbreite zur Verfügung, die sich bei einer Taktrate von beispielsweise 500 MHz (sehr defensive Schätzung) auf immerhin 64 GByte/s beziffert. Zum Vergleich: Dies entspricht einer Nvidia GeForce GT 650M mit GDDR5-Speicher. Es bleibt allerdings abzuwarten, inwieweit die geringe Kapazität des eDRAMs den Grafikspeicher einer dedizierten GPU wirklich zu ersetzen vermag. Zusätzlich kann die Grafikeinheit auch auf ihren eigenen L3-Cache (siehe vorheriger Absatz), den LLC von bis zu 8 MByte und natürlich auch ganz klassisch auf den DDR3-RAM des Systems zurückgreifen.
Kurz ergänzen wollen wir an dieser Stelle noch eine weitere Besonderheit des eDRAMs: Dieser wird laut Intel nicht nur der GPU, sondern auch den CPU-Kernen zur Verfügung stehen – man könnte demzufolge auch von einem sehr großen, "off-Die" L4-Cache sprechen. In bestimmten Anwendungsfällen mit besonders starker Bandbreitenabhängigkeit könnte dieser erhebliche Geschwindigkeitsvorteile bieten; für genauere Analysen gilt es aber erste Benchmarks der entsprechenden Modelle (Core i7-4850HQ, Core i7-4950HQ) abzuwarten.
Auch in puncto Features hat sich bei der GPU einiges getan: Haswell unterstützt nun alle wichtigen aktuellen APIs wie DirectX 11.1, OpenGL 4.0 und OpenCL 1.2. Die Rechenleistung der GPU lässt sich somit auch für GPGPU-Zwecke nutzen, was sich bereits in eingen aktuellen Anwendungen wie Adobe Photoshop und Premiere Pro, vor allem aber in zukünftiger Software auszahlt. Die Bildausgabe erfolgt weiterhin an bis zu drei Displays, welche in verschiedenen Konfigurationen Auflösungen von maximal 4k x 2k darstellen können (Details siehe nachfolgende Folien). Als Schnittstellen stehen HDMI 1.4a und DisplayPort 1.2 inklusive Daisy Chaining zur Verfügung, VGA gibt es dagegen nur noch bei den non-ULV-Versionen. Soll das Signal drahtlos übertragen werden, profitiert der Anwender von der neuen Wireless-Display-Version 4.1, die eine reduzierte Verzögerung für latenzkritische Anwendungen wie Spiele verspricht. Als letzte bedeutsame Neuerung sei noch der überarbeitete Quick-Sync-Transcoder mit abermals verbesserter Geschwindigkeit erwähnt.
Modellübersicht
Am heutigen Tage stellt Intel insgesamt fünf neue Quad-Core-Prozessoren offiziell vor; diese gliedern sich wiederum in drei Modelle der M-Serie (Core i7-4930MX, i7-4900MQ und i7-4800MQ) sowie zwei Modelle der H-Serie (Core i7-4950HQ, i7-4850HQ).
Angeführt vom Topmodell Core i7-4930MX repräsentiert die M-Serie den direkten Nachfolger der bisherigen Ivy-Bridge-Prozessoren. Alle "alten" CPUs werden durch ein Haswell Modell mit identischer Taktrate und gleich großem L3-Cache ersetzt. Als Grafikeinheit dient die mittlere GPU-Ausbaustufe GT2, genannt HD Graphics 4600.
Gänzlich neu sind dagegen die beiden HQ Modelle. Obwohl die Modellnummer eine höhere Rechenleistung suggeriert – beispielsweise beim Vergleich Core i7-4950HQ zu i7-4900MQ –, fällt die Prozessortaktrate 200 bis 400 MHz niedriger aus. Im Gegenzug kommt hier die schnelle GT3e-GPU Iris Pro Graphics 5200 zum Einsatz, die sich Intel allerdings fürstlich bezahlen lässt: Knapp 100 US-Dollar Aufpreis gegenüber einem MQ Modell mit schnellerer CPU sind nicht ohne.
Zusätzlich zu all diesen Modellen wird es wie üblich noch einige weitere Versionen für OEM-Hersteller geben. Hier wäre zum Beispiel der Core i7-4700MQ zu nennen, der die Nachfolge des beliebten Core i7-3630QM antritt. Mit dem Core i7-4702MQ bietet Intel zudem auch wieder ein besonders sparsames Modell mit nur 37 Watt TDP für kleinere Notebooks an. Beide Chips werden auch als HQ-Version angeboten, die laut Intel allerdings mit (fast) identischen technischen Daten, einschließlich der HD-4600-Grafik, daherkommt – einziger Vorteil ist die Unterstützung von vPro. Die schnelle Iris-Pro-GPU ist dagegen nur beim Core i7-4750HQ zu finden.
Bezeichnung | Kerne | Basistakt | Turbo QC / DC / SC | L3-Cache | TDP | GPU-Takt | Preis |
---|---|---|---|---|---|---|---|
M-Serie (HD Graphics 4600) | |||||||
Core i7-4930MX | 4/8 | 3.0 GHz | 3.7 / 3.8 / 3.9 GHz | 8 MB | 57 W | 400-1350 MHz | 1096 $ |
Core i7-4900MQ | 4/8 | 2.8 GHz | 3.6 / 3.7 / 3.8 GHz | 8 MB | 47 W | 400-1300 MHz | 568 $ |
Core i7-4800MQ | 4/8 | 2.7 GHz | 3.5 / 3.6 / 3.7 GHz | 6 MB | 47 W | 400-1300 MHz | 378 $ |
Core i7-4700MQ | 4/8 | 2.4 GHz | 3.2 / 3.3 / 3.4 GHz | 6 MB | 47 W | 400-1150 MHz | OEM |
Core i7-4702MQ | 4/8 | 2.2 GHz | 2.9 / 3.1 / 3.2 GHz | 6 MB | 37 W | 400-1150 MHz | OEM |
H-Serie (Iris Pro Graphics 5200) | |||||||
Core i7-4950HQ | 4/8 | 2.4 GHz | 3.4 / 3.5 / 3.6 GHz | 6 MB | 47 W | 200-1300 MHz | 657 $ |
Core i7-4850HQ | 4/8 | 2.3 GHz | 3.3 / 3.4 / 3.5 GHz | 6 MB | 47 W | 200-1300 MHz | 468 $ |
Core i7-4750HQ | 4/8 | 2.0 GHz | 3.2 / 3.1 / 3.0 GHz | 6 MB | 47 W | 200-1200 MHz | OEM |
H-Serie (HD Graphics 4600) | |||||||
Core i7-4700HQ | 4/8 | 2.4 GHz | 3.2 / 3.3 / 3.4 GHz | 6 MB | 47 W | 400-1200 MHz | OEM |
Core i7-4702HQ | 4/8 | 2.2 GHz | 2.9 / 3.1 / 3.2 GHz | 6 MB | 37 W | 400-1150 MHz | OEM |
Das Testsystem
Wie bereits bei früheren CPU-Tests war die Firma Schenker wieder so freundlich, uns ein passendes Barebone für die Benchmarks bereitzustellen. Das Clevo P150SM, welches von Schenker unter der Bezeichnung W503 vertrieben wird, verfügt über ein besonders leistungsfähiges Kühlsystem, welches auch High-End-Prozessoren wie den Core i7-4930MX mit 57 Watt TDP zu kühlen vermag.
Die weitere Ausstattung des Testgerätes umfasste 2x 4 GByte DDR3-1600-Speicher, eine 128 GByte große mSATA-SSD von Samsung sowie ein ausreichend dimensioniertes 180-Watt-Netzteil. Die verbaute Grafikkarte, eine GeForce GTX 765M, war bei allen Messungen zugunsten der integrierten HD Graphics 4600 deaktiviert.
Wer sich für genauere Informationen zum verwendeten Notebook, Benchmarks mit dedizierter Grafikkarte und Ähnliches interessiert, sollte einen Blick auf unseren ausführlichen Testbericht werfen:
Testkonfiguration:
- Intel Haswell Quad-Cores (ES)
- Intel HM87 Chipsatz
- 2x 4 GByte Micron DDR3-1600-RAM (CL11)
- HD Graphics 4600
- Samsung SSD PM841 (mSATA, 128 GByte)
- 180-Watt-Netzteil
- Windows 8 Enterprise 64 Bit
Benchmarks
Bevor wir nun auf die Ergebnisse blicken, müssen wir noch auf eine Einschränkung unseres Testsystemes hinweisen: Das Clevo P150SM sowie andere Haswell Barebones des taiwanischen Herstellers hatten zum Testzeitpunkt noch Schwierigkeiten, den maximalen Turbo-Boost bei Multi-Threading auszuschöpfen. In unserem Fall bedeutete das: Der Core i7-4800MQ, 4900MQ und 4930MX wurden in den entsprechenden Tests auf maximal 3,4 GHz eingebremst. Hieraus resultiert ein Leistungsverlust von 3 bis 9 Prozent, der bei zukünftigen/finalen Geräten hoffentlich ausgemerzt sein wird. Dennoch wollen wir Ihnen unsere Messungen nicht vorenthalten, ermöglichen sie doch zumindest eine grobe Einordnung der Haswell CPUs. Von diesem Problem nicht betroffen war der Single-Thread-Turbo, der bei allen Modellen vollumfänglich erreicht wurde.
Cinebench R11.5 | |
CPU Multi 64Bit (nach Ergebnis sortieren) | |
Core i7-4930MX | |
Core i7-4900MQ | |
Core i7-4800MQ | |
Core i7-4700MQ | |
Core i7-4702MQ | |
Core i7-3940XM | |
Core i7-3840QM | |
Core i7-3740QM | |
Core i7-3630QM | |
CPU Single 64Bit (nach Ergebnis sortieren) | |
Core i7-4930MX | |
Core i7-4900MQ | |
Core i7-4800MQ | |
Core i7-4700MQ | |
Core i7-4702MQ | |
Core i7-3940XM | |
Core i7-3840QM | |
Core i7-3740QM | |
Core i7-3630QM |
X264 HD Benchmark 4.0 | |
Pass 2 (nach Ergebnis sortieren) | |
Core i7-4930MX | |
Core i7-4900MQ | |
Core i7-4800MQ | |
Core i7-4700MQ | |
Core i7-4702MQ | |
Core i7-3940XM | |
Core i7-3840QM | |
Core i7-3740QM | |
Core i7-3630QM | |
Pass 1 (nach Ergebnis sortieren) | |
Core i7-4930MX | |
Core i7-4900MQ | |
Core i7-4800MQ | |
Core i7-4700MQ | |
Core i7-4702MQ | |
Core i7-3940XM | |
Core i7-3840QM | |
Core i7-3740QM | |
Core i7-3630QM |
TrueCrypt | |
Serpent Mean 100MB (nach Ergebnis sortieren) | |
Core i7-4930MX | |
Core i7-4900MQ | |
Core i7-4800MQ | |
Core i7-4700MQ | |
Core i7-4702MQ | |
Core i7-3940XM | |
Core i7-3840QM | |
Core i7-3740QM | |
Core i7-3630QM | |
Twofish Mean 100MB (nach Ergebnis sortieren) | |
Core i7-4930MX | |
Core i7-4900MQ | |
Core i7-4800MQ | |
Core i7-4700MQ | |
Core i7-4702MQ | |
Core i7-3940XM | |
Core i7-3840QM | |
Core i7-3740QM | |
Core i7-3630QM | |
AES Mean 100MB (nach Ergebnis sortieren) | |
Core i7-4930MX | |
Core i7-4900MQ | |
Core i7-4800MQ | |
Core i7-4700MQ | |
Core i7-4702MQ | |
Core i7-3940XM | |
Core i7-3840QM | |
Core i7-3740QM | |
Core i7-3630QM |
WinRAR - Result (nach Ergebnis sortieren) | |
Core i7-4930MX | |
Core i7-4900MQ | |
Core i7-4800MQ | |
Core i7-4700MQ | |
Core i7-4702MQ | |
Core i7-3940XM | |
Core i7-3840QM | |
Core i7-3740QM | |
Core i7-3630QM |
3DMark 06 - CPU - CPU Score (nach Ergebnis sortieren) | |
Core i7-4930MX | |
Core i7-4900MQ | |
Core i7-4800MQ | |
Core i7-4700MQ | |
Core i7-4702MQ | |
Core i7-3940XM | |
Core i7-3840QM | |
Core i7-3740QM | |
Core i7-3630QM |
3DMark Vantage - 1280x1024 P CPU no PhysX (nach Ergebnis sortieren) | |
Core i7-4930MX | |
Core i7-4900MQ | |
Core i7-4800MQ | |
Core i7-4700MQ | |
Core i7-4702MQ | |
Core i7-3940XM | |
Core i7-3840QM | |
Core i7-3740QM | |
Core i7-3630QM |
3DMark 11 - 1280x720 Performance Physics (nach Ergebnis sortieren) | |
Core i7-4930MX | |
Core i7-4900MQ | |
Core i7-4800MQ | |
Core i7-4700MQ | |
Core i7-4702MQ | |
Core i7-3940XM | |
Core i7-3840QM | |
Core i7-3740QM | |
Core i7-3630QM |
Angesichts der erwähnten Turbo-Problematik müssen unsere Ergebnisse mit gewisser Vorsicht betrachtet werden. Umso beachtlicher ist das Abschneiden der drei Topmodelle, die in vielen Benchmarks ähnliche Werte wie der 200 - 300 MHz schnellere Core i7-3940XM auf Basis der Ivy-Bridge-Architektur erzielen – ein Beleg für die im Schnitt knapp 10 Prozent gestiegene Pro-MHz-Leistung. Im Single-Thread-Test des Cinebench R11.5 (hier wird der maximale Takt erreicht) kann sich der Core i7-4930MX so einen Vorsprung von immerhin 7 Prozent auf den bisherigen Spitzenreiter herausarbeiten. Ähnlich große Zuwächse sind bei taktbereinigter Betrachtung auch in den meisten anderen Anwendungen zu beobachten. Interessantes Randdetail: Die Gewinne durch Intels Hyper-Threading-Technik scheinen sich entgegen unserer Erwartungen kaum verbessert zu haben.
Für eine neue Generation sind Steigerungen kleiner 10 Prozent freilich nicht besonders viel; ohne einen neuen Fertigungsprozess und ein dadurch höheres Taktpotential wäre ein größerer Sprung allerdings auch kaum möglich. Wir werden uns wohl darauf einstellen müssen, dass die Leistung pro Kern in den kommenden Jahren nur noch marginal wachsen wird.
Als Käufer darf man sich zumindest darüber freuen, bei annähernd konstant gebliebenen Preisen die Performance einer deutlich teureren Ivy-Bridge-CPU zu erhalten – dabei kamen die neuen Befehlssätze der Haswell Modelle in unseren Benchmarks noch nicht einmal zum Einsatz. Zukünftige Software mit Unterstützung von AVX2 & Co. könnte weitaus größere Differenzen zwischen beiden Generationen zeigen.
Leistungsaufnahme
Durch den neuen Sockel der Haswell CPUs sowie ein demzufolge abweichendes Testsystem müssen wir an dieser Stelle auf einen direkten Verbrauchsvergleich mit Ivy Bridge verzichten. Außerdem sei nochmals auf das Turbo-Problem hingewiesen, welches nicht nur die Performance, sondern natürlich auch die Leistungsaufnahme beeinflusst hat. Aus diesem Grund haben wir bei allen nachfolgenden Messungen die anliegende Taktrate angegeben.
Wie schon bei unseren letzten Tests haben wir die Leistungsaufnahme des gesamten Notebooks hinter dem Netzteil vermessen, weshalb nur die Relationen verschiedener CPUs zueinander, nicht aber die absoluten Zahlen selbst ausgewertet werden können.
Alle Verbrauchsmessungen wurden zwecks bestmöglicher Vergleichbarkeit mit maximaler Displayhelligkeit, aktivierter WLAN-Verbindung sowie dem Energiesparplan "Höchstleistung" durchgeführt. Vor allem im Leerlauf kommt es dadurch zu recht hohen Werten um 26 Watt, die sich zwischen den einzelnen Modellen jedoch kaum unterscheiden: Dank ausgefeilter Energiesparmeachnismen ist die Leistungsaufnahme bei allen fünf CPUs im Rahmen der Messgenauigkeit identisch.
Leichte Unterschiede zeigen sich dagegen im Single-Thread-Test des Cinebench R11.5. Je 100 MHz Mehrtakt schlagen sich hier in einem rund 1 bis 2 Watt höheren Energiebedarf nieder – zwischen dem Core i7-4702MQ und dem i7-4930MX summiert sich dies auf eine Differenz von knapp 9 Watt. Angesichts des geringen Performance-Unterschiedes beider Modelle wird deutlich, dass die Energieeffizenz bei Taktraten von fast 4 GHz stark nachlässt.
Entsprechend der in unserem Fall auf 3,4 GHz begrenzten Taktfrequenzen ist die Leistungsaufnahme der drei schnellsten CPUs im Multi-Threading-Test des Cinebench nahezu identisch. Der nur 3,2 GHz schnelle Core i7-4700MQ gibt sich mit etwa 9 Watt weniger zufrieden – als ausgesprochen sparsam kann man aber auch diesen High-End Quad-Core nicht unbedingt bezeichnen. Für kleinere oder besonders schlanke Notebooks sieht Intel deshalb den i7-4702MQ vor, dessen 10 Watt niedrigere TDP den Verbrauch des Gesamtsystems auf 68 Watt drückt.
Die traditionell höchste Leistungsaufnahme lässt sich im synthetischen Stresstest Prime95 beobachten. Zu Beginn des Tests takten zunächst alle Kandidaten mit dem maximal möglichen (Multi-Thread-)Turbo von 2,9, 3,2 oder 3,4 GHz. Der Core i7-4900MQ, i7-4800MQ und i7-4702MQ überschreiten bei dieser Taktrate allerdings die vom Hersteller definierte, maximale Leistungsaufnahme – dieses (beabsichtigte) Verhalten kennen wir bereits von Sandy und Ivy Bridge. Nach einer gewissen Zeitspanne von rund 30 Sekunden greift die im Prozessor integrierte PCU (Power Control Unit) ein und regelt den Takt soweit zurück, dass die zulässige TDP wieder eingehalten wird. Dadurch wird stets die bestmögliche Performance erzielt, ohne dabei die thermischen Reserven des jeweiligen Notebooks zu überfordern.
Der Core i7-4930MX und 4700MQ können ihre Taktrate dagegen konstant halten. Beim 4930MX ist dies zum einen auf die hohe TDP von 57 Watt, zum anderen aber auch auf den auf 3,4 GHz limitierten Turbo des Clevo-Barebones zurückzuführen. Der 4700MQ überschreitet als langsamstes Modell seiner TDP-Klasse die zulässigen 47 Watt Maximalverbrauch ohnehin nicht.
Einen Ausnahmefall stellt die gleichzeitige Belastung von CPU und GPU mit Prime95 und FurMark dar. Gegenüber alleiniger Ausführung von Prime95 ist zwar nur ein leichter Anstieg der Leistungsaufnahme zu verzeichnen, doch wird nun ein Teil des TDP-Budgets für die Grafikeinheit benötigt. Abhängig von der jeweiligen Einstufung konnten wir hier CPU-/GPU-Taktraten von rund 2,2/1,1 GHz (37-Watt-Modell), 2,7/1,1 GHz (47-Watt-Modelle) beziehungsweise 3,0/1,2 GHz (57-Watt-Modell) beobachten.
Fazit
Großer Wurf oder überflüssiges Update? Beim Blick auf die nackten Leistungswerte dürften sich wieder einmal die Geister scheiden, ob Intels neue Architektur als Erfolg zu bezeichnen ist. Die Zugewinne in aktueller Software sind sicherlich zu klein, um den Umstieg von einem Sandy-Bridge- oder Ivy-Bridge-Prozessor zu rechtfertigen – zumindest bei den hier getesteten Quad-Core-Modellen.
Man darf dabei allerdings mehrere Dinge nicht vergessen: Zum einen, auf welch hohem Niveau sich bereits der Vorgänger bewegt hat. Intels Tick-Tock-Zyklus sorgt zwar dafür, dass die Sprünge zwischen einzelnen Generationen relativ klein ausfallen, doch bringen die jährlichen Updates einen konstanten Leistungszuwachs – Hauptkonkurrent AMD kann sich mittlerweile nur noch mit den CPUs der Core-i3-Serie und darunter messen. Zum anderen ist Haswell mit Features wie AVX2 und FMA vor allem auf künftige Anwendungen ausgelegt, die von den neuen Befehlssatzerweiterungen drastisch profitieren könnten.
Noch einmal spannend dürfte es werden, wenn Intel in Kürze die neuen Ultrabook-Modelle vorstellt, zu denen bereits einige interessante Details durchgesickert sind – zum Beispiel das moderne 1-Chip-Design, die auf 15 Watt TDP verringerte Leistungsaufnahme sowie eine deutlich stärkere Grafikeinheit. Einen kleinen Vorgeschmack zum Thema GPU bietet unser Spezialartikel zur HD Graphics 4600, der mittleren Ausbaustufe ("GT2") der Haswell-Grafik.
Abschließend nochmals unser Dank an die Firma Schenker, die uns diesen Test ermöglicht hat. Unter diesem Link können Sie das Testgerät konfigurieren und bestellen.