Quelques semaines après le lancement du Penryn, le premier microprocesseur gravé en 45nm produit par Intel, AMD lance sa grande contre-offensive sous la forme du Phenom et de sa plate-forme Spider. Longtemps attendu, le Phenom vient succéder aux Athlon 64 X2 dont la durée de vie n'aura été que trop longue. Force est en effet de constater que depuis la sortie des Core 2 Duo chez Intel, c'était pour mémoire en juillet 2006, AMD n'aura hélas jamais été en mesure de contrarier son concurrent principal, du moins en ce qui concerne les performances. Car faute de pouvoir lutter avec Intel sur ce terrain, AMD n'a eu d'autres choix que de procéder à des baisses de prix successives sur ses Processeurs, quitte à sacrifier ses marges et son image de marque.
Une image de marque déjà bien écornée par la douloureuse transition vers le Socket AM2 et la mémoire DDR2, une transition qui s'était, rappelons-le, soldée par une absence totale de gain de performances. Parallèlement, le passage au procédé de fabrication en 65nm fut, autant être clair, un désastre : les quelques rares Athlon 64 X2 gravés en 65nm chauffant autant et consommant autant que leurs équivalents en 90nm...
Attendu comme le sauveur, le Phenom est aussi le premier processeur quadri-cœurs que propose AMD pour les PC de bureau, après une première incursion dans le monde des serveurs en septembre dernier avec le Barcelona, un processeur qui se serait vendu jusqu'à présent à 10.000 unités, soit une quantité négligeable. Qui plus est, le Phenom a accumulé un retard que l'on ne sait tout simplement plus quantifier... tant les annonces, contre-annonces et volte-face se sont succédé à son sujet. En face, Intel continue d'opposer à AMD la force tranquille, le fondeur proposant des processeurs quadri-cœurs depuis plus d'un an maintenant tout en revendiquant plus de 3 millions d'unités écoulées à travers le monde. Le Phenom va-t-il permettre à AMD de se remettre en course ?
AMD Phenom : une architecture quadri-cœurs native !
Initialement connue sous le nom de code K8L, l'architecture du Phenom s'est vue rebaptisée K10 alors que le fondeur de Sunnyvale accumulait les retards quant à l'élaboration de celle qui devait succéder à l'architecture K8 des Athlon 64. Des retards qui ont du reste poussé AMD à tirer sur la corde le plus longtemps possible, pour prolonger au maximum la durée de vie du K8 avec la sortie surprise, en plein été, d'un Athlon 64 X2 6400+ cadencé à 3,2 GHz, un processeur qui bizarrement n'a jamais été distribué à la presse pour test. Et alors qu'Intel enchaînait les lancements de Processeurs quadri-cœurs, AMD aura attendu le mois de septembre dernier pour proposer son tout premier processeur quadri-cœurs dédié au monde serveur avec le lancement du Barcelona, un Opteron qui utilise l'architecture K10. Car AMD s'est toujours refusé à utiliser la solution mise en œuvre par Intel qui consiste à réunir sur une seule et même puce deux noyaux double-cœur, préférant tout mettre en œuvre pour concevoir une architecture quadri-cœurs native...Le die Phenom : 4 coeurs sur un seul et même morceau de silicium
Voilà donc le point fort de l'architecture K10 mise en œuvre au sein du Phenom : la présence de quatre cœurs natifs sur un seul et même die. AMD reprend au passage la même recette qu'il avait déjà appliquée avec ses premiers Athlon 64 X2 puisque les cœurs du Phenom sont reliés entre eux par le System Request Interface lequel est accolé au Crossbar Switch, semblable dans le principe au contrôleur du même nom que l'on retrouve sur les puces graphiques et dont le rôle est d'aiguiller les données et les demandes du système entre les cœurs. Sur le papier, cette architecture native permet l'échange direct de données entre les cœurs, notamment via la mémoire cache de troisième niveau (nous en reparlerons plus tard), et ce sans repasser par le bus système comme c'est le cas chez Intel avec les Core 2 Quad. Indiscutablement plus raffinée, cette architecture native n'est pas forcément synonyme de réel gain dans la pratique comme nous le verrons plus loin.
Vue d'ensemble de l'architecture K10 telle qu'implémentée dans Phenom
Architecture AMD K10 : un petit goût de K8 ?
Quant à l'architecture de chacun des cœurs de notre K10, elle est globalement identique à ce qu'AMD propose déjà avec son K8 avec toutefois des améliorations de-ci, de-là. On retrouve ainsi sans surprise trois unités arithmétiques ou ALU pour les calculs entiers alors que la nouveauté est à chercher du côté des unités 128 bits en charge des instructions SSE sur les flottants. Alors que la prise en charge SSE sur les entiers ne bouge pas, le K10 embarque dorénavant deux unités SSE pouvant traiter chacune 128 bits par cycle. Dans la pratique cela se traduit par des temps d'exécution deux fois plus rapides qu'auparavant et cela devrait naturellement permettre au K10 d'offrir des gains de performances intéressants dans les applications multimédias ayant massivement recours aux instructions SSE comme les jeux ou encore les applications de montage vidéo.Des chemins plus larges au sein de la puce notamment qui profitent aux instructions SSE
Parmi les nouveautés du K10, il convient également de citer les nouvelles unités de prédictions qui sont sur le papier censées améliorer les performances des applications écrites avec des langages de programmation orientés objets comme Visual Basic, C++ et Java. Rappelons que les programmes informatiques font souvent appel à des branchements qui permettent, lorsque telle ou telle condition est remplie, de sauter directement d'une partie à une autre partie du programme sans exécuter tout le code devenu inutile pour x raisons. Afin d'améliorer les performances d'exécution de ces applications, les processeurs intègrent des unités de prédiction de branchement dont le rôle est de deviner si telle ou telle branche sera prise pour anticiper l'exécution du code. La nouveauté du K10 vient de l'inclusion d'une unité de prédiction des branches indirectes, une unité qui est capable de deviner un branchement dont l'adresse peut changer en cours d'exécution. C'est nouveau pour AMD, dont le K8 ne pouvait prédire que les branchements directs, mais Intel propose une telle subtilité depuis... le Pentium 4 dans son édition Prescott !
Prédiction de branchements améliorée sur Phenom
Parallèlement, AMD inaugure le Speculative Out-of-Order Load Execution, une fonction qui permet de gérer les instructions de lecture mémoire s'exécutant dans le désordre. Baptisée « Memory Disambiguation » chez Intel, et donc présente dans tous les processeurs Core 2, cette fonction est capable de prédire si une opération de lecture peut être dépendante des écritures en cours. Si ce n'est pas le cas, l'instruction de lecture est immédiatement traitée. Dans un autre ordre d'idée, la gestion de la pile a été revue et le K10 se dote d'une unité dédiée répondant au nom de Sideband Stack Optimizer. Celle-ci garde une trace des valeurs de registre et vise ainsi à réduire le nombre de micro-opérations qu'il faudra exécuter lors du décodage des opérations x86.
AMD K10 : Un cache à trois niveaux
Du côté de la mémoire cache, le K10 n'apporte pas de grands bouleversements face au K8 à ce détail près que le cache est dorénavant réparti sur trois niveaux. Chacun des cœurs se voit en effet doté de 128 Ko de mémoire cache L1 de premier niveau avec 64 Ko pour les instructions et 64 Ko pour les données alors que chaque cœur dispose de 512 Ko de mémoire cache L2 de second niveau avec une associativité de 16 voies (contre 24 chez Intel avec l'architecture Penryn). A l'inverse d'Intel et de ses Core 2, le cache de second niveau du K10 n'est donc pas partagé. Les applications monothreadées gourmandes en mémoire cache s'en trouveront vraisemblablement pénalisées puisque le processeur ne peut pas reconfigurer à la volée la quantité de cache disponible pour s'adapter aux exigences d'un programme. AMD dote par ailleurs son K10 d'un troisième niveau de mémoire cache à hauteur de 2 Mo. Cette mémoire L3 est en revanche partagée entre les quatre cœurs et sert principalement aux échanges inter-cœurs avec une associativité de 32 voies.Agencement de la mémoire cache au sein de Phenom
En matière de temps de latence, un paramètre éminemment important lorsque l'on évoque la mémoire cache, le K10 nous réserve de bonnes surprises, puisqu'AMD ne renouvelle heureusement pas l'erreur commise avec les K8 en 65nm. Ces derniers avaient en effet vu la dégradation des temps de latence de la mémoire cache de second niveau par rapport à leurs homologues en 90nm. Le tableau ci-dessous dresse un rapide bilan des temps de latence des diverses mémoires cache exprimé en cycles processeur :
Athlon 64 X2 coeur Windsor 90nm | Athlon 64 X2 coeur Brisbane 65nm | AMD Phenom | Intel Core 2 Penryn (45nm) | |
Cache L1 | 3 | 3 | 3 | 3 |
Cache L2 | 13 | 20 | 15 | 15 |
Cache L3 | N/A | N/A | 49 | N/A |
Alors que les temps de latence du cache de second niveau sont tout à fait acceptables et meilleurs que ceux des Athlon 64 X2 gravés en 65nm, le temps de latence du cache de troisième niveau semble assez élevé. Cela s'explique notamment par le mécanisme « split plane » qui rend le cache solidaire du contrôleur mémoire et de sa fréquence de fonctionnement comme nous le verrons un peu plus loin.
Un nouveau contrôleur mémoire
Comme le K8, le K10 intègre un contrôleur mémoire directement au sein du processeur. Alors que sur la plate-forme Intel le contrôleur mémoire est toujours situé dans le northbridge, c'est à dire le chipset, du moins en attendant la prochaine architecture Nehalem, AMD a depuis longtemps choisi de rapatrier le contrôleur mémoire dans le processeur afin de réduire au maximum les temps de latence liés aux accès mémoire. Le K10 intègre donc un contrôleur mémoire double canal de seconde génération compatible avec la mémoire DDR2 et ce jusqu'à la DDR2-1066. Chaque canal de 64 bits (72 bits en réalité avec le contrôle de parité) peut fonctionner seul ou en tandem pour une plus grande souplesse. Ainsi il est possible de faire travailler ensemble les deux contrôleurs 64 bits pour obtenir la bande passante maximale ; c'est le mode Ganged ou 128 bits, ou bien de les faire travailler indépendamment pour des opérations de lecture/écritures simultanées : c'est le mode Unganged.Plusieurs nouveautés sont également à signaler comme par exemple l'introduction d'algorithmes censés améliorer la gestion des pages mémoires afin de réduire les conflits ou encore l'inclusion de buffers plus larges et donc mieux adaptés aux débits de la DDR2. Les prefetchers, ces unités capables de charger des données avant qu'elles ne soient demandées par le programme, sont améliorées et alors que le K8 voyait ses prefetchers fonctionner uniquement sur le cache L2, le K10 dispose de deux unités de prefetching opérant sur le cache L1 afin de s'affranchir de la latence du cache de second niveau : les données peuvent donc être préchargées directement depuis la mémoire dans le cache L1. Qui plus est, AMD augmente la taille du fetch pour permettre le stockage de 32 bytes : en clair, on retrouve plus d'instructions disponibles à exécuter dans chaque fetch. Quant à notre contrôleur mémoire il dispose lui aussi d'un prefetcher amélioré et assisté d'un nouveau buffer de stockage des opérations d'écriture. En prime le contrôleur DDR2 gère l'adressage mémoire physique sur 48 bits pour supporter un maximum de 256 To de mémoire.
Contrôleur mémoire et prefetching
Enfin, et ce n'est pas forcément la moindre des nouveautés, le K10 inaugure la technologie « split plane ». L'alimentation électrique du contrôleur mémoire est ainsi indépendante de l'alimentation électrique des cœurs. Cela permet de séparer la fréquence de fonctionnement du processeur de celle du contrôleur mémoire. A l'origine, cette fonction permet, sur les Processeurs Opteron, d'avoir un contrôleur mémoire qui opère plus rapidement que le reste de la puce. Seulement voilà, sur Phenom c'est exactement l'inverse puisque le contrôleur mémoire du K10 fonctionne à une fréquence inférieure : 1,8 GHz sur Phenom 9500 et 9600. Terminons en signalant que le contrôleur mémoire DDR2 du K10 est déjà prêt pour la mémoire DDR3 : une mémoire qui sera adoptée avec le passage au 45nm du K10.
Arrivée de l'HyperTransport 3.0 et flexibilité du Socket
Contrairement aux Processeurs Intel qui dépendent toujours de ce bon vieux FSB ou Front Side Bus, les processeurs AMD utilisent depuis longtemps déjà un bus système bidirectionnel baptisé HyperTransport qui connecte le processeur au reste du système. Alors que la version serveur du K10 utilise des liens HyperTransport de première génération, le Phenom adopte l'HyperTransport dans sa version 3.0. Sur le papier, l'HyperTransport 3.0 offre, tel qu'il a été défini par le consortium, un débit maximum théorique de 20,8 Go/s dans chaque sens contre 11,2 Go/s pour l'HyperTransport 2.0 alors qu'il est cadencé à 2,6 GHz. Oui mais voilà, AMD annonce une bande passante brute comprise entre 14 et 16 Go/s pour les premiers Phenom utilisant l'HyperTransport 3.0, une bande passante inférieure donc aux capacités théoriques du bus. Il faudra en effet attendre les prochaines montées en fréquence du Phenom pour que le bus HyperTransport voie sa fréquence et son débit augmenter. Pour l'heure, le Phenom 9600 dispose d'un lien HyperTransport à 1,8 GHz : on est loin des 2,6 GHz théoriques. Cela nous donne une bande passante théorique de 14,4 Go/s contre 10,6 Go/s pour le FSB1333 d'Intel et 12,7 Go/s pour le FSB1600.
HyperTranport 3.0 : le bus système du Phenom
La bonne nouvelle, c'est que le bus HyperTransport 3.0 est compatible avec les infrastructures existantes en HyperTransport 1.0/2.0. Concrètement, cela signifie qu'un Phenom au format AM2+ peut être inséré dans toute carte mère AM2 et qu'il y fonctionnera sans souci, à condition que le BIOS soit mis à jour. Naturellement, dans un tel cas de figure le débit du bus HyperTransport sera ramené à celui de l'HyperTransport 1.0 : le processeur sera d'autant plus bridé que la vitesse du contrôleur mémoire sera réduite alors que le mécanisme « split-plane » s'évanouit. Inversement, les Cartes mères AM2+ acceptent les processeurs AM2 comme les Athlon 64 X2. Bien entendu, il n'est pas question d'utiliser un Phenom sur une plate-forme antérieure au Socket AM2, le Socket 939 étant physiquement incompatible.
Les autres nouveautés
Le passage à l'architecture K10 est également l'occasion pour AMD d'introduire des nouveautés plus subtiles. C'est ainsi que le K10 prend en charge les quelques instructions SSE3 que le K8 ne gérait pas encore alors que le K10 inaugure également les instructions SSE4a. Celles-ci n'ont bien sûr rien à voir avec le SSE4 introduit tout récemment par Intel dans ses nouveaux processeurs Penryn en 45nm puisqu'il s'agit ici d'instructions développés par AMD.Alors qu'Intel introduisait récemment la division Fast Radix-16 sur ses Core 2 en 45nm afin d'accélérer le traitement des divisions arithmétiques, AMD améliore également les performances de ses processeurs en matière de division. Toutefois, si le K10 est plus rapide sur les divisions d'entiers que le K8, il n'est en revanche pas capable de traiter les divisions par groupe de 4 bits comme Penryn.
Prise en charge améliorée de la virtualisation
Le K10 profite également d'une prise en charge améliorée de la virtualisation grâce à diverses optimisations, initialement destinées au Barcelona, la version serveur du K10. Il s'agit d'accélérer le fonctionnement des machines virtuelles notamment en améliorant la gestion de la mémoire ou encore en réduisant les temps de transition entre l'hyperviseur et une machine virtuelle. AMD évoque également un usage réduit des ressources processeur dans les environnements virtualisés.
Une gestion plus fine de l'énergie
Le K10 est l'occasion pour AMD d'améliorer la gestion de l'énergie au sein de ses Processeurs. Pour cela, le fondeur introduit des raffinements à tous les étages et regroupe l'ensemble de ces fonctions sous la bannière Cool & Quiet 2.0. Pour commencer, le K10 offre un nouvel état de consommation C1E qui s'active lorsque tous les cœurs sont en mode inactifs (mode idle). Supporté par les chipsets AMD, ce nouveau mode déconnecte le lien HyperTransport et place la mémoire en mode basse consommation alors que les fréquences internes se voient elles aussi réduites. Autre nouveauté, le Dual Dynamic Power Management qui découle directement du mécanisme « split-plane » évoqué précédemment et permet de gérer de manière indépendante les fréquences des cœurs d'exécution de celles du northbridge intégré. En clair, les changements de fréquence du processeur se font sans affecter le voltage et la fréquence du contrôleur mémoire et sans réduire la vitesse du lien HyperTransport.AMD Phenom et la technologie Cool & Quiet 2.0
Parallèlement, la fréquence de chacun des quatre cœurs peut être contrôlée manuellement ce qui donne à la technologie Cool & Quiet une bien meilleure granularité pour la modulation des fréquences en fonction de la charge de travail. Qui plus est, lorsqu'il a besoin de moins de courant, le processeur peut dorénavant en notifier les régulateurs de voltage et ceux-ci peuvent réduire le nombre de phases, toujours dans le but d'améliorer l'efficacité et de réduire la consommation lorsque les cœurs sont inactifs.
Place à l'OverDrive
Avec le Phenom, AMD introduit un tout nouvel utilitaire logiciel baptisé OverDrive. Bien que ce nom fasse immanquablement penser à Intel et à ses processeurs de la grande époque des 486, il s'agit ici de singer le logiciel nTune de NVIDIA ou encore le récent XTU (Extreme Tuning Utility) d'Intel, ce dernier étant inutilisé puisque toujours en développement... Léger, et installé en à peine quelques clics de souris, le logiciel OverDrive surprend d'emblée par son interface relativement soignée et par la richesse de ses fonctions. Véritable clone de CPU-Z, le logiciel étant d'ailleurs aussi lent à charger, l'utilitaire d'AMD affiche diverses informations sur votre système à commencer par les fréquences de fonctionnement, les temps de latence de la mémoire, la quantité de mémoire embarquée, la configuration des liens HyperTransport ou encore le détail des coefficients multiplicateurs et autres informations sur la quantité de mémoire cache offerte par le processeur.AMD OverDrive, quand AMD réussit là ou Intel et NVIDIA échouent...
Disposant de deux modes d'affichage (simple et avancé), le logiciel autorise la manipulation des coefficients multiplicateurs pour chacun des quatre cœurs. On peut donc revoir à la baisse les fréquences de fonctionnement et ce sans passer par le BIOS alors qu'il est possible d'overclocker le système en jouant sur la fréquence de base du lien HyperTransport. Les temps de latence mémoire sont ajustables directement depuis l'onglet mémoire et le logiciel dispose d'un module de test intégré. Mieux, l'onglet Status Monitor du logiciel permet de voir en temps réel les fréquences et tensions d'alimentation des divers composants du système mais aussi la charge de chacun des cœurs.
AMD Phenom 9600 et 9500 : Génération désenchantée
Le Phenom, nom de code Agena, est donc la première puce quadri-cœurs native d'AMD pour les PC de bureau. Gravé en 65nm SOI dans les usines AMD de Dresde, le Phenom totalise un peu plus de 450 Millions de transistors pour une taille de die de 285 mm². Le processeur se présente logiquement au format Socket AM2+, un socket qui est rappelons le identique sur le plan physique à l'actuel Socket AM2 avec un total de 940 broches. Utilisant comme indiqué précédemment un lien HyperTranport 3.0, le Phenom devait initialement être lancé dans une version 9700 à une fréquence de fonctionnement de 2,4 GHz. Hélas, trois fois hélas, le Phenom 9700 est tout simplement reporté au trimestre prochain sous prétexte d'un bug affectant ses performances.
En attendant, AMD propose pour ce lancement une « gamme » composée de deux Processeurs : le Phenom 9500 dont la fréquence est de 2,2 GHz et le Phenom 9600 cadencé de son côté à 2,3 GHz. Exit donc les processeurs FX puisqu'AMD n'est pour l'instant pas capable de lancer sa gamme Phenom avec un modèle très haut de gamme.
AMD Phenom 9600 : Tout est chaos... A côté, Tous mes idéaux : des mots Abimés... Je cherche un processeur, qui saura m'aider...
Cadencé à 2,3 GHz, le Phenom 9600 utilise un coefficient multiplicateur fixé à 11,5 alors que le modèle 9500 se contente d'un coefficient multiplicateur de 11x. Dans les deux cas, le coefficient multiplicateur est bloqué. En matière de mémoire cache, les Phenom 9500 et 9600 affichent la même configuration avec un total de 2 Mo de mémoire cache de second niveau et 2 Mo de mémoire cache de troisième niveau. Au final, seule la fréquence de fonctionnement distingue donc réellement le Phenom 9500 du Phenom 9600 puisque même l'enveloppe thermique est identique avec un TDP de 95 Watts, selon AMD.
Le Phenom 9600 vu par CPU-Z
Consommation électrique, échauffement et overclocking
Nous avons bien sûr profité de notre test pour vérifier la consommation électrique de nos diverses machines ainsi que leur échauffement. Pour cela nous utilisons un wattmètre qui indique la consommation globale de notre système (et non du seul CPU). Nos deux plates-formes étant à base de carte mère Gigabyte nous utilisons l'utilitaire maison, EasyTune 5, pour les relevés de températures de nos processeurs. A noter que les deux types de mesure, consommation et échauffement, sont effectués avec autant d'instance de Prime en cours d'exécution que le processeur compte de coeurs. Pour la plate-forme Intel nous utilisons le ventilateur boîte d'Intel alors que pour AMD nous avons recours au système de refroidissement CoolerMaster installé par Matériel.net dans notre machine Phenom. Les températures que nous faisons figurer sont donc données à titre indicatif.Core 2 Quad Q6600 | Core 2 Extreme QX9770 | Athlon 64 X2 6000+ | Phenom 9600 | |
Consommation globale | 308 Watts | 300 Watts | 340 Watts | 305 Watts |
Température sous Prime | 54° C | 65° C | 60° C | 47° C |
Comme on peut le voir, la consommation électrique de la configuration Phenom 9600 est comparable à ce que nous obtenons avec un Core 2 Quad Q6600 signé Intel, le concurrent direct du Phenom. En revanche le Phenom s'échauffe moins et c'est probablement dû au refroidissement CoolerMaster, nettement plus élaboré que le ventirad box d'Intel. A moins bien sûr que le stepping B3 de notre Q6600 le pénalise alors que les Q6600 du commerce utilisent un stepping G0 réputé plus performant. Face à l'Athlon 64 X2 6000+ qui grimpe à 60° C, le Phenom 9600 signe une belle prestation. Quant au dernier-né d'Intel il s'échauffe bien vite: 65° C en pleine charge mais la consommation reste mesurée puisqu'elle flirte avec les 300 Watts, soit autant que celle du Phenom 9600...
Question overclocking enfin, et bien qu'AMD semble éprouver le plus grand mal à faire grimper les fréquences de son Phenom, nous avons quand même essayé de le pousser dans ses retranchements. Le coefficient multiplicateur du Phenom 9600 étant par défaut bloqué, le seul moyen d'overclocker consiste à modifier la fréquence de référence du bus système. Fixée rappelons-le à 200 MHz, nous avons pu passer la fréquence du bus système à 210 puis 215 et enfin 220 MHz pour obtenir une fréquence de 2,53 GHz. A cette vitesse, la machine était stable et nous avions tout de même pris soin d'augmenter légèrement la tension processeur. Au-delà des 2,5 GHz, nous n'avons pas réussi à stabiliser Windows Vista qui plantait de manière assez régulière au bout de quelques minutes d'utilisation et ce malgré nos divers réglages dans le BIOS.
Carte mère Gigabyte GA-MA790FX-DQ6
Gigabyte figure parmi les partenaires de lancement du Phenom. En conséquence, le taïwanais signe la plupart des Cartes mères équipant les machines de test Phenom et c'est ainsi que notre système Matériel.net était équipé de la GA-MA790FX-DQ6. Au format ATX, cette carte mère embarque le nouveau chipset d'AMD, le RD790FX, un chipset grosso-modo équivalent à son prédécesseur mais gravé en 65nm et doté d'un contrôleur PCI-Express de seconde génération gérant un total de 42 lignes. Le southbridge accompagnant le RD790FX n'évolue pas puisqu'il s'agit toujours d'un composant SB600 dont les limitations sont bien connues (pas plus de quatre connecteurs Serial-ATA, pas de support RAID 5, etc.).
Résolument haut de gamme, DQ6 oblige, la carte de Gigabyte adopte un système de refroidissement passif identique à celui déjà présent sur les dernières cartes mères du fabricant avec chipset Intel. Les différentes constituantes du chipset sont ainsi recouvertes d'un radiateur en cuivre alors qu'un heat-pipe parcourt le tout et débouche sur l'ultime radiateur, ce dernier reposant sur les composants MOSFET de l'étage d'alimentation.
Gigabyte GA-MA790FX-DQ6
Avec quatre emplacements mémoire DDR2 et un socket AM2+, la GA-MA790FX-DQ6 dispose de quatre connecteurs PCI-Express 16x (les deux connecteurs orange étant câblés sur 8x), un connecteur PCI-Express 1x et deux ports PCI. En CrossFire classique (2 cartes), les deux ports PCI-Express de couleur bleue sont câblés chacun sur 16x, en CrossFireX (4 cartes graphiques), tous les ports se voient ramenés à un câblage 8x. Un mot au passage sur le design de la carte : les quatre slots PCI-Express 16x étant empilés les uns sur les autres vous serez obligés d'utiliser des cartes graphiques simple slot si vous souhaitez insérer quatre cartes à la fois. Aux quatre ports Serial-ATA 3 Gb/s gérés par le SB600 d'AMD, Gigabyte ajoute une puce additionnelle pour gérer deux ports supplémentaires, toujours en 3 Gb/s, soit un total de six connecteurs Serial-ATA, alors qu'une seconde puce additionnelle permet de contrôleur les deux ports eSATA extérieurs. L'IDE est toujours de la partie et Gigabyte propose un connecteur pour le lecteur de disquette ainsi qu'une puce Texas Instruments pour la gestion du FireWire.
Le dernier chipset d'AMD étant toujours dépourvu de contrôleur réseau, Gigabyte fait appel à deux composants Realtek en Gigabit Ethernet, modèle RTL8111B. Ceux-ci offrent une fonction de Teaming qui maximise le débit en regroupant les deux connexions. La partie audio dépend également d'un contrôleur Realtek sur huit canaux avec prise en charge DTS Connect, modèle ALC889A. Niveau connectique extérieure, la carte offre deux ports PS/2, six ports USB 2.0, deux connecteurs RJ45, un port série rescapé, un connecteur FireWire, deux ports eSATA, deux sorties audio numériques (SPDIF et TOSLINK) ainsi qu'une rampe de six connecteurs audio au format mini-jack.
Le trouble fête : Intel Core 2 Extreme QX9770
Bien décidé à ne faire aucun cadeau à AMD, Intel sort de son chapeau un processeur pour le moins inattendu sous la forme du Core 2 Extreme QX9770. Profitant de l'architecture Penryn (voir pour plus de détails notre dossier) et gravé en 45nm, ce processeur quadri-cœurs ne verra pas le jour sur le marché avec le premier trimestre 2008. Pourtant, Intel l'a distribué à la presse histoire de bien enfoncer le clou quant à son avance technologique sur AMD, une avance qui ne fait aujourd'hui plus aucun doute. Pour faire bref, le Core 2 Extreme QX9770 affiche une fréquence de fonctionnement de 3,2 GHz soit 200 MHz de plus que le tout récent Core 2 Extreme QX9650 dont il reprend par ailleurs toutes les caractéristiques à un détail près ; le FSB.Intel Core 2 Extreme QX9770 : la surprise du chef
Quitte à ennuyer AMD, Intel profite en effet du QX9770 pour prouver que son FSB ou bus système n'est pas (encore) mort. Ainsi le QX9770 dispose d'un bus système cadencé à 1600 MHz (4x400 MHz) contre 1333 MHz (4x333 MHz) pour le précédent QX9650. Les performances mémoires devraient donc croître légèrement puisque la bande passante théorique passe de 10,6 Go/s à 12,7 Go/s. Avec une configuration des caches identique à celle de son prédécesseur soit 6 Mo de cache L2 partagé par paire de cœurs pour un total de 12 Mo de cache L2, le Core 2 Extreme QX9770 est compatible avec les Cartes mères dotées d'un chipset Intel X38. Ainsi, nous n'avons eu aucun souci pour faire fonctionner ce processeur sur notre carte mère Gigabyte GA-X38-DQ6. Naturellement il n'est pas compatible avec les cartes mères nForce 680i SLI, NVIDIA ne proposant toujours aucune solution au problème de compatibilité avec les Penryn... Dernier détail, le Core 2 Extreme QX9770 utilise un coefficient multiplicateur de 8x, un coefficient plus faible que celui du QX9650 grâce à la hausse du FSB.
Le Core 2 Extreme QX9770 vu par CPU-Z
Conditions de test
Nos lecteurs les plus fidèles le savent, nous n'avons pas pour habitude de nous épancher sur les conditions de test de tel ou tel nouveau matériel considérant que ceci relève généralement de la cuisine interne. Pourtant, l'attitude inédite d'AMD nous force à sortir de notre réserve. L'américain organisait en effet la semaine dernière un événement européen à Varsovie en Pologne. Evénement où le fondeur mettait à disposition des journalistes de toute l'Europe une cinquantaine de machines pour tests. Curieusement ces machines étaient pourvues d'un Phenom 9700, vous savez ce processeur qui ne sortira pas avant 2008, alors que le nombre de benchmarks installé sur les machines se comptait sur les doigts d'une seule main. Naturellement, AMD interdisait formellement d'installer ses propres benchmarks... Une attitude inqualifiable qui nous fait dire qu'AMD a visiblement oublié ce qu'est la presse indépendante.
Quant à notre test, il a fort heureusement été réalisé de manière autonome (c'est-à-dire non contrôlé par AMD), avec une machine Phenom montée par Matériel.net et reçue, la faute là encore à AMD, moins de 48 heures avant le lancement du processeur. Mais rendons hommage à AMD France qui a fait en sorte que nous ayons notre propre système Phenom quand la plupart de nos confrères européens ont dû se contenter des tests effectués sur place en Pologne...
Dernier détail qu'il faut souligner, l'insistance d'AMD et de ses porte-paroles à vouloir à tout prix nous faire parler d'une plate-forme, la plate-forme Spider constituée du Phenom, du chipset RD790FX et des récentes Cartes Graphiques Radeon HD 3850/3870. Seul hic, l'unique fonction spécifique de cette plate-forme, le CrossFireX, ne sera pas disponible avant... janvier 2008 au mieux ! Non messieurs d'AMD, on ne masque pas les faiblesses d'un produit, en l'occurrence un processeur, en l'englobant dans une notion de pseudo plate-forme.
Notre configuration
Pour tester le Phenom, nous avons employé la configuration dont le détail figure ci-dessous :
- Carte mère Gigabyte GA-MA790FX-DQ6 (BIOS F2h),
- 2 Go Mémoire DDR2 OCZ PC10000 @ DDR2-1066,
- Carte graphique NVIDIA GeForce 8800 GTX,
- 2 Disques durs Western Digital Raptor 150 Go,
- Alimentation Tagan TG900-U33 (900 Watts)
- Carte mère Gigabyte GA-X38-DQ6 (BIOS F6B),
- 2 Go Mémoire DDR2 OCZ PC10000 @ DDR2-1066,
- Carte graphique NVIDIA GeForce 8800 GTX,
- 2 disques durs Western Digital Raptor 150 Go,
- Alimentation Tagan TG900-U33 (900 Watts)
3DMark 06 - v1.1.0 - Test processeur
On commence par 3DMark 06 et son test processeur. Le Core 2 Extreme QX9770 crève naturellement le plafond alors qu'il faut chercher le Phenom dans le bas du classement, derrière le Core 2 Quad Q6600 d'Intel ! Selon 3DMark 06, le Core 2 Quad Q6600 serait 7,6% plus rapide que le Phenom 9600... L'écart de 100 MHz qui existe entre le Phenom 9600 et le Phenom 9500 influe à hauteur de 4% sur les performances d'après 3DMark 06. Face à l'Athlon 64 X2 6000+, le Phenom 9600 se montre ici 47% plus rapide.
Sandra Xii - Test processeur
Pour Sandra qui passait récemment en version 12, les performances processeur des deux Phenom semblent bien faibles. En effet, le Core 2 Quad Q6600 d'Intel est encore devant et si sur le score MFLOPS l'avantage du processeur d'Intel est minime il est beaucoup plus conséquent lorsqu'on regarde le score MIPS qui indique le nombre de millions d'instructions à la seconde que le processeur peut exécuter. Le Core 2 Quad Q6600 l'emporte avec des performances 29% supérieures.
Sandra Xii - Test mémoire
Traditionnellement, les performances mémoire des processeurs AMD sont élevées grâce à l'intégration du contrôleur mémoire directement dans le processeur. C'est ainsi qu'on retrouve en tête du test mémoire de Sandra les Athlon 64 X2 6000+ et 4600+ qui se payent le luxe de devancer le petit dernier d'Intel, le QX9770, dont le FSB1600 lui permet d'afficher des performances mémoires 8% supérieures à celles de son prédécesseur le QX9650. Mais intéressons nous aux Phenom dont les performances mémoire se révèlent catastrophiques. Le contrôleur mémoire d'AMD semble ici avoir perdu toute son efficacité... D'après Sandra, le QX9770 d'Intel offrirait des performances mémoire 33% supérieures aux Phenom...
PCMark Vantage - Suite de test jeux
Tout juste sorti des laboratoires de FutureMark, PCMark Vantage donne sa préférence au Core 2 Extreme QX9770 d'Intel qui se montre ici 7% plus rapide que le modèle précédent, le QX9650. Notre Phenom 9600 est à égalité avec le Core 2 Quad Q6600 alors qu'il affiche des performances 3,5% supérieures au Phenom 9500. Sans aller jusqu'à comparer le Phenom 9600 au Core 2 Extreme QX9770, le Core 2 Extreme QX6850 se montre 7% plus véloce sous PCMark Vantage.
ScienceMark 2.0 - Primordia
Traditionnellement, ScienceMark 2.0 est favorable aux processeurs AMD. D'ailleurs l'Athlon 64 X2 6000+ se hisse devant le Core 2 Extreme QX6700 puisque l'application est monothreadée. Surprise, le Phenom fait ici moins bien que ses prédécesseurs puisque l'Athlon 64 X2 4600+ est plus rapide que le Phenom 9500 alors que l'Athlon 64 X2 6000+ affiche des performances 22% supérieures au Phenom 9600. Du reste, le Phenom 9600 affiche ici un score égal au Core 2 Quad Q6600 d'Intel.
Avertissement
La plupart des tests applicatifs présents sur cette page voient leurs résultats présentés en secondes avec la mention de l'unité en axe des abscisses. La lecture des graphiques est donc inversée.Cinebench 10
Cinebench, le test basé sur le moteur de rendu 3D professionnel de Cinema4D nous revenait tout récemment en version 10. Massivement parallèle, Cinebench 10 tire profit des Processeurs à plusieurs coeurs. En tête nous retrouvons un quatuor Intel avec les Core 2 Extreme QX9770, QX9650, QX6850 et QX6700. La cinquième place échoie au Core 2 Quad Q6600 qui se montre 17% plus rapide que le Phenom 9600. Ce dernier étant lui même 4% plus véloce que le Phenom 9500. Fort heureusement pour AMD, le gain lié au quadri-coeurs est tout de même palpable face aux Athlon 64 X2.
3DSMax 8 SP3 - 1280*1024 - Radiosité
Comme sous Cinebench, notre test 3DSMax se base sur le rendu d'une scène 3D pour évaluer les performances de nos systèmes. Les résultats sont ici en secondes. Les Core 2 Extreme d'Intel se taillent toujours la part du lion et le Core 2 Quad Q6600 du haut de sa cinquième place affiche toujours des performances supérieures au Phenom 9600. Ce dernier est d'ailleurs aussi rapide que le Phenom 9500.
Adobe Photoshop CS3
Avec Photoshop CS3 nous mesurons le temps nécessaire à l'application d'un filtre de flou radial sur une image volumineuse de 18 Mo. Là encore Phenom fait peine à voir puisque les résultats enregistrés sont du niveau d'un processeur double-coeur ! Notre Core 2 Quad Q6600 est ainsi bien plus rapide à appliquer le filtre que le Phenom 9600. Et s'il nous fallait une confirmation, la montée en fréquence de 100 MHz du Phenom 9600 sur le Phenom 9500 se traduit en un gain d'une seconde !
Compression de fichiers - Winrar 3.71
On passe à la compression de fichiers avec un jeu de fichiers d'un plus de 800 Mo composé de petits et de gros fichiers. Une fois de plus les processeurs Intel sont largement en tête et le Core 2 Quad Q6600 distance largement le Phenom 9600. Songez que pour effectuer la même opération, il faut 33 secondes de plus au Phenom qu'au Core 2 Quad...
Encodage vidéo - TMPGEnc 4.3.1.222
L'encodage vidéo n'a jamais été le fort d'AMD et pourtant TMPGenc est le premier test de cette page à ne pas trop pénaliser les Phenom. Rappelons que nous mesurons le temps nécessaire à l'encodage d'une vidéo AVI au format MPEG2. Certes, le Phenom 9600 est une fois encore en retrait face au Core 2 Quad Q6600 mais l'écart est bien plus réduit avec seulement deux secondes de pénalité pour le Phenom 9600. Reste naturellement qu'Intel mène la danse et que les cinq premiers processeurs du classement sont tous signés Intel.
Pinnacle Studio 11.1
Fort des bons résultats obtenus avec TMPGenc nous nous attendions à de bonnes performances des Phenom sous Studio lors du rendu de notre projet au format MPEG4. Avec cette subtilité que le plug-in de rendu MPEG4 de Studio n'est pas multithreadé... Conséquence l'Athlon 64 X2 6000+ fait mieux que le Phenom 9600 alors que le Phenom 9500+ fait à peine mieux que l'Athlon 64 X2 4600+... Face au Core 2 Quad Q6600, le Phenom 9600 effectue le rendu de notre projet avec un retard de 47 secondes. Avec une telle prestation nous ne tirerons pas sur l'ambulance en comparant le Phenom 9600 à un Core 2 Extreme de toute façon intouchable.
Mathematica 5.2
Application mathématique utilisée par les physiciens, chimistes et autres étudiants en mathématiques, Mathematica inflige une correction aux Phenom, une de plus serait-on tenté de dire. Ainsi les Phenom 9600 et 9500 terminent derrière l'Athlon 64 X2 6000+. Et oui Mathematica étant une application monothreadée, le quadri-coeurs ne sert à rien et le petit dernier d'AMD en pâtit sévèrement... Notre Core 2 Quad Q6600 s'affiche comme 47% plus performant que le Phenom 9600.
Call Of Duty 2 v1.3 - 1024x768x32
Pour Call Of Duty 2, les Core 2 Extreme restent les Processeurs de choix lorsqu'il s'agit du framerate ultime. Le Core 2 Quad Q6600 se hisse loin devant les Phenom avec un avantage de 19% sur le Phenom 9600. Ce dernier étant 3% plus rapide que le Phenom 9500. Seul réconfort, Phenom réussit, de très peu, à afficher des performances supérieures aux Athlon 64 X2.
Far Cry v1.4 - 1024x768x32
A l'instar de Call Of Duty et de quasiment tous nos logiciels de test, Far Cry plaide en faveur des Core 2 Extreme. Les Phenom d'AMD se font malheureusement rétamer et l'Athlon 64 X2 6000+ fait mieux que le Phenom 9600 avec des performances 4% meilleures ! Comparativement, le Core 2 Quad Q6600 est presque indécent... avec des performances 41% supérieures au Phenom 9600...
Supreme Commander - 1024x768x32
Nous refermerons cette triste série de tests avec le dernier RTS de Chris Taylor, Supreme Commander. Le jeu sait tirer profit des processeurs multi-coeurs mais ce n'est hélas pas suffisant puisqu'une fois de plus le Core 2 Quad Q6600 fait mieux que nos Phenom. L'écart est toutefois plus mesuré que sous Far Cry par exemple. Selon Supreme Commander, le Core 2 Quad Q6600 est 4% plus véloce que notre Phenom 9600. Face à l'Athlon 64 X2 6000+, Phenom 9600 se révèle 12% plus performant.
L'année 2007 semble se terminer aussi mal qu'elle a commencé pour AMD puisque le Phenom est, autant être clair dès le début, une véritable déception. Après des reports en série, et des promesses tonitruantes, on se souvient de déclarations faisant état d'un K10 30 ou 40% plus rapide que le Core 2 d'Intel (voir ce communiqué de presse), AMD nous propose en définitive un processeur qui semble pour le moins boiteux. La faute tout d'abord à une architecture qui manque clairement d'ambition à tel point d'ailleurs qu'on pourrait rebaptiser le Phenom en Athlon 64 X4... Car si AMD a tout misé sur le côté natif de son processeur quadri-cœurs, le fondeur a repris en quasi-intégralité l'architecture K8 des Athlon 64 se contentant d'optimiser, certes fort judicieusement, ce qui pouvait encore l'être. Ainsi, l'arrivée d'unités de calcul en virgule flottante sur 128 bits constitue un progrès de taille pour le traitement des instructions SSE mais c'est tout de même loin d'être une révolution.
Pour autant, l'architecture K10 n'est pas mauvaise, non. Le gros des problèmes est à chercher ailleurs et plus précisément du côté du procédé de fabrication et des fréquences de fonctionnement. Soyons là encore très clair, AMD ne maîtrise absolument pas le procédé de fabrication en 65nm. Alors que la production de puces totalisant plus de 450 millions de transistors est déjà un défi industriel colossal, AMD ne parvient pas encore à les faire monter en fréquence. A vouloir à tout prix faire du quadri-cœurs natif pour se démarquer d'Intel, AMD se prend royalement les pieds dans le tapis et son Phenom est clairement handicapé par ses trop faibles fréquences. Initialement prévu pour une fréquence de 2,4 GHz lors du lancement, AMD a à la dernière minute annulé le Phenom 9700 pour se rabattre sur le modèle 9600 cadencé à 2,3 GHz... Pour mémoire, lorsqu'Intel a lancé son architecture Core, le processeur le plus rapide de la gamme, le Core 2 Extreme QX6800 tournait à l'époque à 2,93 GHz !
Le total manque de maîtrise sur le procédé de fabrication contraint qui plus est AMD à faire des concessions sur les atouts et les spécificités de son architecture K10. Alors que la technologie Split-Plane permet en théorie de séparer la fréquence du processeur de celle de son contrôleur mémoire, histoire que ce dernier opère plus rapidement, c'est exactement l'inverse qui se produit sur Phenom ! Quant au lien Hyper Tranport 3.0 il est encore sous exploité puisqu'AMD ne l'implémente pas totalement, là encore à cause d'un problème de fréquence. Et que dire de la quantité de mémoire cache ? Avec seulement 4 Mo de mémoire cache, tout niveau confondu, Phenom semble bien en retrait des Penryn et de leur 12 Mo de mémoire cache, ce qui ne manque pas de pénaliser certaines applications.
Tout sauf phénoménal (ndlr : Julien, tu n'as pas honte ?), le Phenom qui ne figurera décidément pas dans le journal de Claire Chazal n'a pour points positifs que sa consommation et sa chauffe, deux paramètres qui sont effectivement largement mieux maîtrisés que sur les Athlon 64 X2. Faute de pouvoir ne serait-ce qu'inquiéter Intel, le Phenom 9600 étant globalement moins performant que le Core 2 Quad Q6600 sorti il y a plus d'un an maintenant, AMD doit se battre encore et toujours sur le terrain des prix. C'est ainsi que le Phenom 9600 à 2,3 GHz est proposé au prix public conseillé de 190 euros TTC contre 169 euros TTC pour le Phenom 9500. A ce tarif le Phenom peut simplement prétendre exister et incarner une alternative à l'offre d'Intel. Ne revenons pas sur la notion de gamme, gamme Phenom inexistante à nos yeux puisque les 100 MHz qui séparent le modèle 9500 du modèle 9600 sont à peu près ridicules. Dernière précision, ne comptez pas retrouver prochainement des machines Phenom chez les grands OEM comme ou Hewlett Packard... AMD n'ayant pas les capacités de production pour ses clients grand compte, le Phenom est pour l'heure réservé au channel, c'est-à-dire aux revendeurs en ligne et aux boutiques de quartier.
Quant à l'évolutivité de l'architecture K10 et à la possibilité que Phenom se bonifie en vieillissant, nous sommes suffisamment remplis d'amères désillusions pour ne pas y croire à l'heure où nous écrivons ces lignes... Mais qui sait, une bonne surprise peut toujours arriver ?
Mise à jour du 23 novembre : Alors qu'AMD annonçait fièrement, à l'occasion du lancement européen de ses Phenom, des tarifs alléchants avec 190 euros TTC pour le Phenom 9600 à 2,3 GHz et 169 euros TTC pour le modèle 9500, ces tarifs ayant servi de base à notre conclusion se sont hélas révélés inexacts. Il faut en effet compter un peu plus de 260 euros TTC pour le Phenom 9600 contre 225 euros TTC pour le Phenom 9500. A ces tarfis, le Phenom n'a plus aucun intérêt face à l'offre d'Intel et plus particulièrement face au Core 2 Quad Q6600, un processeur qui se négocie dans les 230 euros TTC, s'affiche comme plus performant et s'overclocke bien plus facilement.
- Venez discuter de ce test dans le forum