Pour mémoire l'une des caractéristiques principales de l'architecture NetBurst était de permettre une facile montée en fréquence, car à l'époque de sa mise au point, Intel continuait de croire en la supériorité de la fréquence sur l'efficacité de l'architecture, cette dernière théorie étant défendue vigoureusement par son concurrent de toujours, AMD. Mais les ingénieurs d'Intel avaient semble-t-il omis quelques détails, que les immuables lois de la physique leur ont rappelés. Avec des fréquences toujours plus délirantes, non seulement les processeurs chauffent de manière démesurée, mais en plus leur consommation électrique explose littéralement alors que le gain en terme de performances n'était clairement pas au rendez-vous ! Pensez qu'à fréquence égale un Pentium 4 Prescott était plus lent que son homologue Northwood. Bref, Intel se devait de réagir et si pendant trois années la firme de Santa-Clara a offert un véritable boulevard à AMD, le temps de la riposte a sonné avec l'arrivée du Conroe, ou Intel Core 2 Duo.
Malgré son nom à coucher dehors, le dernier bébé d'Intel profite d'une toute nouvelle architecture répondant au nom d'Intel Core. Pour concevoir cette nouvelle architecture, les ingénieurs d'Intel ont fait table rase du passé en se concentrant non plus sur la fréquence, mais bel et bien sur l'efficacité. Cela sera-t-il suffisant pour contrer les Athlon 64 d'AMD ? C'est la réponse que nous tenterons d'apporter dans cette preview technologique qui trouvera son épilogue par quelques indispensables benchmarks.
Architecture Intel Core : jetons les bases
Reprenant certains des fondements du Pentium M, la nouvelle architecture Intel Core qui nous préoccupe aujourd'hui vise à corriger la plupart des errements du NetBurst des Pentium 4. Et si Intel se base en partie sur le travail qu'il a déjà effectué avec les Processeurs mobiles, ce n'est pas franchement un hasard. En effet, tandis que les Pentium 4 Northwood rencontraient déjà un certain succès dans le monde des PC de bureau, le fondeur s'est bien vite rendu compte que ceux-ci étaient totalement inadaptés aux Ordinateurs Portables. Il faut se souvenir que les portables Pentium 4 étaient généralement massifs, bruyants avec en prime une autonomie déplorable ! Autant de raisons qui avaient poussé Intel à plancher sur le Banias, le premier processeur pensé dès le départ pour consommer peu, s'échauffer modérément tout en délivrant des performances équivalentes si ce n'est supérieures à ses pairs. Héritier des Pentium M, la micro-architecture Intel Core introduit nombre d'optimisations destinées à offrir le meilleur ratio performance/consommation possible. D'après les services marketing du groupe, l'architecture Intel Core s'illustre grâce à cinq technologies ou vecteurs que nous allons évoquer dans les lignes qui suivent. Mais avant toute chose, soulignons que contrairement aux Pentium 4, les processeurs Intel Core 2 Duo profitent d'une architecture à pipeline court : seulement 14 pipelines contre 31 pour les Prescott...Intel Core : un objectif ambitieux...
On commence par la technologie Intel Wide Dynamic Execution qui se pose en héritière du moteur d'exécution dynamique des Pentium Pro, Pentium II et autres Pentium III. L'idée est ici de rendre chacun des cœurs d'exécution littéralement plus large afin de lui permettre de récupérer, répartir, exécuter et retourner jusqu'à quatre instructions par cycle d'horloge contre un maximum de trois instructions pour les Pentium M et Pentium 4. Intel en profite au passage pour augmenter la taille du cache dédié au stockage des instructions alors que les algorithmes de prédiction de branchement sont annoncés comme plus efficaces. Concrètement, les prédictions se font à un rythme d'une par cycle d'horloge, contre une prédiction tous les deux cycles d'horloge sur les Pentium 4 et Pentium M.
Au-delà de ces nouveautés, la grande innovation introduite par l'architecture Intel Core est à n'en pas douter la « macrofusion ». Derrière ce terme barbare se cache un procédé visant à réduire les temps d'exécution et pour bien saisir sa portée, il nous faut rappeler un concept de base commun à nombre de processeurs. Dans le cadre de l'exécution d'un programme, ou plus particulièrement d'une fonction bien précise, le processeur reçoit diverses instructions x86. Avant d'être exécutées, celles-ci sont pré-décodées, triées et enfin décodées avant d'atteindre les ALU, unités arithmétiques, qui auront finalement la charge de les exécuter. Avec la macrofusion Intel propose de combiner, en amont, des paires d'instructions en une seule instruction interne, ou micro-op, pendant le décodage afin de gagner en efficacité. Du coup notre décodeur d'instructions, qui est capable, rappelons-le, de traiter un maximum de quatre instructions par cycle, se voit en mesure de récupérer un total de cinq instructions depuis la file d'attente, deux instructions étant alors fusionnées et traitées par un seul et même décodeur. Pour l'heure, un petit nombre d'instructions prédéfinies profite de ce traitement de faveur comme, et ce n'est qu'un exemple parmi d'autres, une comparaison suivie d'un saut conditionnel.
Le fonctionnement d'un processeur sans macrofusion et après...
La nouvelle micro-architecture d'Intel profite également de la fusion des micro-ops, ou micro opérations, une fonction introduite avec les Pentum M et étendue aux instructions SSE depuis le Yonah ou Intel Core Duo. Typiquement, les processeurs récents qui fonctionnent en Out-Of-Order éclatent les macro-instructions x86 en opérations basiques avant que celles-ci n'atteignent le pipeline. En fusionnant des micro-opérations provenant d'une même macro-op, on réduit le nombre de micro-ops qu'il faut exécuter tout en améliorant ce qu'on appelle le scheduling, c'est-à-dire l'agencement des tâches au sein du processeur. Intel indique qu'avec l'architecture Core le nombre de micro-ops qu'il est possible de fusionner est étendu, sans toutefois donner plus de précision.
Intel Core : du neuf côté multimédia et gestion mémoire
Avec le Pentium 4, Intel avait encore étendu le vénérable jeu d'instructions x86 en proposant des instructions 128-bits dites SSE (Streaming SIMD Extension). Spécialement conçues pour répondre aux besoins des programmes multimédias, les instructions SSE restent d'actualité avec l'Intel Core. C'est donc fort logiquement que la dernière micro-architecture d'Intel gère les jeux d'instructions SSE, SSE2 et SSE3 tout en inaugurant de nouvelles instructions regroupées sous la bannière SSE4. Ces dernières sont au nombre de huit et se concentrent sur la vidéo. Non content d'étendre le spectre de ses instructions SSE, Intel propose avec son architecture Core l'Advanced Digital Media Boost. Il s'agit ici d'augmenter significativement la vitesse de traitement des instructions SSE. Jusqu'à présent, les instructions SSE s'exécutaient au rythme d'une instruction tous les deux cycles d'horloge. Avec la micro-architecture Intel Core, le fondeur se propose tout simplement de multiplier par deux le débit en faisant en sorte qu'une instruction 128-bit SSE s'exécute en un seul et même cycle d'horloge. Pour y parvenir, Intel s'appuie dorénavant sur trois unités arithmétiques, contre deux pour le Core Duo, et toutes sont capables de traiter les instructions SSE en 128 bits donc.Les possibilités offertes par l'Advanced Digital Media Boost
Du côté de la mémoire cache, l'Intel Core est pourvu de la technologie Advanced Smart Cache déjà étrennée par le processeur Yonah autrement connu sous le nom d'Intel Core Duo. Indispensable pour un processeur double-cœur, cette fonction découle du SmithField ou Pentium D. Il faut en effet se souvenir que lorsqu'Intel lançait le Pentium D, son premier processeur double-cœur, chacun des cœurs disposait alors de sa propre mémoire cache de second niveau sans pour autant qu'une communication entre les mémoires caches ne soit possible sauf à passer par le chipset et à engorger le bus système. Dorénavant, la mémoire cache de second niveau est partagée entre les cœurs, et ce, de manière dynamique. Ainsi, en fonction de la charge de l'un des deux cœurs, le processeur peut décider d'allouer 70 % de la mémoire cache au premier cœur et 30 % au second tout en réajustant en permanence cette répartition. Mieux, si chacun des cœurs a besoin des mêmes données en cache, l'architecture Intel Core ne stockera celles-ci qu'une seule fois évitant de gaspiller de la place comme avec les Pentium D ou même les Athlon 64 d'AMD. Enfin, lorsqu'un seul des deux cœurs a un besoin impérieux de mémoire cache de second niveau, l'Advanced Smart Cache peut lui attribuer la totalité du cache ce qui n'est pas possible sur les architectures concurrentes où, dans un cas de figure semblable, la mémoire cache du second cœur ne sert finalement à rien. Qui plus est, Intel annonce une bande passante maximale de 10,4 Go/s pour la mémoire cache de second niveau.
Diagramme de l'architecture Intel Core 2 Duo
Outre l'architecture de la mémoire cache, les ingénieurs d'Intel se sont également penchés sur les accès mémoire afin d'offrir une bande passante et des performances supérieures. Si l'Intel Core est toujours dépourvu d'un contrôleur mémoire intégré, qui reste donc l'apanage des seuls Athlon 64, Intel propose une fonction qu'il appelle « Memory Disambiguation ». L'idée est ici d'améliorer l'efficacité de traitement dans le désordre des instructions en raccourcissant les délais d'accès aux données stockées en mémoire. Pour y parvenir, les unités d'exécution ont désormais la possibilité de charger, et ce, de manière spéculative, les données requises par les instructions sur le point de s'exécuter, avant même que toutes les instructions précédentes ne se soient exécutées. La chose est un rien complexe, mais il s'agit en gros de s'assurer que les données sont là où et quand les cores d'exécution en ont besoin. Dans un processeur comme le Pentium 4, lorsque le CPU remet en ordre les instructions en attente, il ne peut pas reprogrammer les opérations que l'on qualifie de load (chargement de données pour les instructions sur le point de s'exécuter) avant les opérations de store (stockage des instructions), car il pourrait violer certaines dépendances de données. Intel utilise donc divers algorithmes pour évaluer si un load peut être exécuté avant le store précédent afin d'offrir le plus haut niveau de parallélisme alors qu'une unité entière est dédiée aux opérations load et une autre aux opérations store dans le processeur.
Le die du Core 2 Duo
L'architecture Intel Core se dote, en plus de la fonction dite de « Memory Disambiguation », d'un plus grand nombre de prefetchers. Rappelons que les prefetchers ont pour rôle de charger certaines données (ou instructions) avant que celles-ci ne soient requises par le processeur pour les placer dans le cache du CPU afin d'accélérer encore la rapidité d'exécution globale. Intel utilise dorénavant deux prefetchers par cache L1 et deux prefetchers pour le cache L2, soit un total de huit prefetchers pour un processeur double-coeur. En augmentant le nombre de load qui peuvent s'exécuter depuis la mémoire cache plutôt que la mémoire système participe à réduire les temps de latence et donc à améliorer les performances.
Intel Core 2 Duo : Les caractéristiques dans les grandes lignes
Les Core 2 Duo reprennent qui plus est à leur compte nombre des améliorations passées d'Intel au niveau des « T's ». On a donc droit au support de VT, la technologie de virtualisation, à la prise en charge EM64T pour les environnements 64 bits ou encore au Execute Disable Bit. En revanche, l'HyperThreading n'est pas de la partie du moins avec les Core 2 Duo. L'EIST qui régule la fréquence et le voltage du processeur est toujours d'actualité et du côté des fonctions de gestion d'énergie, Intel clame à qui veut l'entendre que son Conroe offre une meilleure granularité puisqu'il est capable de couper la plupart des unités de la puce, même en pleine charge. Nous aurons probablement l'occasion de revenir sur ces petits détails lors de prochains tests. Sachez que physiquement les Core 2 Duo se présentent au format Socket LGA775, Intel n'ayant pas jugé utile de changer de socket, ce qui est en soi plutôt une bonne nouvelle.
Intel Core 2 Duo E6700 vu par CPU-Z
Intel Core 2 Duo : Quid du support ?
Comme vous le verrez en page suivante, nous avons utilisé pour nos tests de performances une carte mère à base de chipset i975X. Ce dernier est commercialisé depuis plusieurs mois déjà et l'on peut donc s'interroger sur la compatibilité éventuelle des cartes mères i975X actuelles avec le Core 2 Duo. Malheureusement, il s'avère que la plupart des fabricants de cartes mères n'ont pas suivi les lignes guides d'Intel en omettant la mise en place de certaines diodes thermiques. De fait, nombre de cartes-mères i975X ne sont tout simplement pas compatibles avec le Core 2 Duo. Chez Asus notamment, la P5WD2E Premium ne gère pas le Conroe et si la D975XBX d'Intel est compatible, il faut tout de même disposer de la révision 304 de la carte.Intel D975XBX : compatible Conroe à condition d'avoir la bonne révision
- Carte mère Asus A8R32-MVP Deluxe,
- Athlon 64 FX-60 @ 2.8 GHz,
- 2x512 Mo DDR400,
- Disque dur Maxtor 300 Go Serial-ATA,
- 2x Radeon X1900 XT en CrossFire
- Carte mère Intel D975XBX
- Intel Core 2 Duo E6700 (2,66 GHz),
- 2x512Mo Corsair Twin2X DDR2-800,
- Disque dur Maxtor 300 Go Serial-ATA,
- 2x Radeon X1900 XT en CrossFire
3DMark06 - Test processeur
On démarre cette série de tests avec le test avec 3DMark06. La dernière version en date de 3DMark profite d'un module de test processeur qui se distingue par son aspect multi-threadé. Comme on peut le constater d'après notre graphique, le Core 2 Duo E6700 est ici 9% plus rapide que notre Athlon 64 FX-60 overclocké à 2,8 GHz.
PCMark05 - Test processeur
Notre second test synthétique semble nettement plus sensible aux charmes du dernier bébé d'Intel. L'avantage pour la firme de Santa-Clara atteint ici 18% toujours face à l'Athlon 64 FX-60.
POVRay
On enchaîne avec POVRay où nous nous basons sur l'indication du score CPU retourné par le logiciel après le rendu d'une scène 3D. Comme on peut le constater Intel l'emporte haut la main avec un gain de 44% sur l'Athlon 64 FX-60 tournant pour mémoire à 2,8 GHz.
Windows Media Encoder 9.0
L'encodage vidéo semble ne pas poser de souci particulier à notre Conroe qui continue de ridiculiser l'Athlon 64 FX-60 d'AMD. Le Core 2 Duo E6700 est ici 14% plus performant et s'acquitte de sa tâche neuf secondes plus rapidement.
Adobe Photoshop Elements 2.0
Le test Photoshop Elements 2.0 consiste à appliquer sur une photo d'une résolution élevée le filtre de flou radial et de mesurer le temps requis par l'opération. Là encore la sanction est sévère pour AMD, le Core 2 Duo E6700 étant pratiquement 20% plus rapide.
Adobe Premiere Pro 2.0
Sous Premiere nous calculons le temps requis pour exporter une vidéo sous forme d'images GIF successives. Pas de chance pour AMD, le Core 2 Duo E6700 est une fois encore plus rapide en effectuant l'opération 30% plus rapidement que son concurrents l'Athlon 64 FX-60 pour mémoire overclocké à 2,8 GHz, soit la fréquence d'un FX-62.
Encodage MP3 - LAME
L'encodage de fichiers MP3 avec le fameux LAME réussit une fois de plus au Core 2 Duo E6700. Face à l'Athlon 64 FX-60 le gain atteint ici les 17%. La démonstration a le mérite d'être sans appel : à fréquence égale l'architecture Intel Core est plus efficace que le K8 des Athlon 64.
Encodage vidéo - XMPEG 5.03
Avec XMPEG nous mesurons le temps requis pour convertir une vidéo haute définition (1920x1080) de 24 secondes en un fichier DivX haute défition. Le Core 2 Duo E6700 se hisse sans grande suprise devant l'Athlon 64 FX-60, se montrant 28% plus rapide. Concrètement il faut 32 secondes de plus à l'Athon 64 FX-60 pour produire le même fichier que celui obtenu avec le Core 2 Duo E6700.
Quake 4
Quake 4, avantage Intel ! Voilà comment on peut résumer les performances du dernier processeur d'Intel face à l'Athlon 64 FX-60. Le framerate est ici 22% supérieur sur la configuration à base de Core 2 Duo E6700.
Half Life 2 - Lost Coast
Le niveau gratuit d'Half-Life 2, j'ai nommé Lost Coast, est une véritable correction pour AMD, le Core 2 Duo E6700 s'affichant dans ce cas précis comme 46% plus performant que l'Athlon 64 FX-60 !
Far Cry
Sous Far Cry, qui a longtemps été le domaine de prédilection des Processeurs AMD, la donne est bouleversée par l'arrivée du Conroe. Ici le processeur d'Intel surpasse l'Athlon 64 FX-60, ancienne référence incontournable, de quelques 35%.
F. E. A. R.
On termine avec F. E. A. R. qui ne fait que confirmer les observations précédentes même si l'écart se réduit sensiblement. La faute aux Cartes Graphiques ? Qu'importe le Core 2 Duo E6700 surclasse l'Athlon 64 FX60 d'environ 8%.
Conclusion
Reste que le Core 2 Duo, ici évalué dans sa version E6700, est particulièrement impressionnant, nous disions plus haut bluffant, et prometteur. Non seulement il s'affiche comme largement plus performant que nombre de Processeurs actuels, mais en plus il ne chauffe quasiment pas et consomme peu, bien que ces deux derniers paramètres ne soient pas encore quantifiables, Intel ne l'autorisant pas. Ils laissent toutefois supposer de très bonne chose lorsqu'il s'agit d'overclocking. Si nous ne pouvons conclure sur une preview et qu'il nous faut garder une certaine prudence, l'Intel Core 2 Duo s'affiche déjà comme une excellente nouvelle qui risque de provoquer un véritable basculement notamment chez les joueurs majoritairement équipés en AMD. Après tant d'années de vaches maigres sur le front des processeurs de bureau, Intel semble enfin en avoir sous le pied ! Chapeau bas...
Rendez-vous fin juillet pour le lancement officiel mondial du Core 2 Duo.