Cinq ans après l'avènement de ses premiers Phenom utilisant l'architecture Stars, AMD s'apprête à moderniser son offre en matière de processeurs x86. Certes, nous avions bien eu en cours de route une révision de l'architecture Stars avec l'arrivée des Phenom II, mais rien de fondamentalement nouveau et surtout rien qui ne puisse remettre en question l'ultra-domination d'Intel sur le créneau des performances notamment.
C'est en cette fin d'année, et non sans un certain retard, qu'AMD lance enfin sa nouvelle architecture répondant au nom de code Bulldozer. Et AMD de faire revivre pour l'occasion la marque FX, puisque les premiers processeurs utilisant l'architecture Bulldozer sont baptisés FX, un nom qui rappellera bien des souvenirs aux amateurs d'Athlon 64. Mais si à l'époque les Athlon FX étaient des processeurs simple cœur, les nouveaux FX que nous propose AMD en cette fin 2011 sont des modèles 8 cœurs, rien que ça !
Le retour de la marque FX est-il synonyme de retour des performances ? Comment se positionnent ces nouveaux processeurs FX face à l'offre actuelle d'Intel ? Autant de questions qui trouveront leur réponse dans les pages qui suivent.
Une architecture revisitée faites de modules
Avec les Phenom et Phenom II, AMD nous proposait l'architecture K10, nom de code Stars. Relativement efficace dans certains domaines, celle-ci peinait toutefois à soutenir la comparaison avec l'offre d'Intel. Le fossé état devenu encore plus criant depuis l'apparition des processeurs Sandy Bridge, les fameux Core de seconde génération. L'arrivée de Bulldozer signe la première vraie nouvelle micro-architecture chez AMD depuis Phenom voire même peut être avant. D'aucuns diront en effet que l'architecture K10 n'est qu'un dérivé du K8 des Athlon 64... Nous ne rentrerons pas dans ces débats préférant vous emmener dans un tour d'horizon des particularités de cette architecture.Parmi les objectifs poursuivis par AMD dans la mise au point de Bulldozer il y a l'efficacité énergétique, la modularité de l'architecture ou encore le fait de favoriser les fréquences de fonctionnement à l'efficacité de l'architecture, un pari plutôt risqué nous le verrons.
La grande nouveauté de l'architecture Bulldozer c'est avant tout la technologie CMT (Cluster Multithreading). Il s'agit ici d'une approche assez intéressante et plutôt différente de ce que nous avons coutume de voir, notamment chez Intel où le SMT (Simultaneous Multithreading) règne en maître. Avec Bulldozer, AMD remet en question, d'une certaine manière, la notion de cœur d'exécution x86. L'un des concepts de base de Bulldozer réside en fait dans ce qu'AMD appelle un module. Un module Bulldozer est donc constitué de deux cœurs d'exécution x86. Deux vrais cœurs ? Pas tout à fait... Nos deux cœurs vont en effet se partager un certain nombre de ressources comme la partie en charge du fetch des données (autrement dit leur chargement), mais aussi l'unité de décodage des instructions ou encore celle en charge des calculs sur les flottants. Le cache de second niveau est également partagé entre les deux cœurs d'un même module ce qui ici est clairement l'élément le moins novateur.
Concept de module Bulldozer
Mais pourquoi partager des unités entre nos cœurs dans un même module plutôt que de les doublonner ? La raison est simple : économiser des transistors bien sûr et donc de la surface de die, mais aussi optimiser la consommation du processeur. Typiquement, il est reconnu que dans les architectures x86 l'unité en charge du décodage est assez vorace en énergie. La partager entre deux cœurs permet d'optimiser lesdits paramètres énergétiques. De manière plus pragmatique, d'autres unités sont rarement sollicitées en permanence ou à leur pleine capacité. C'est le cas notamment de l'unité dédiée aux calculs sur les nombres flottants. De fait, la mutualiser entre deux cœurs est finalement assez pertinent puisqu'elle est alors véritablement sollicitée. Chaque module Bulldozer comporte donc deux cœurs et peut exécuter simultanément deux threads.
À noter une certaine flexibilité induite par ce fonctionnement : dans le cas où un seul thread s'exécute au sein du module, celui-ci a accès à toutes les ressources partagées. À cette fluidité s'ajoute une certaine modularité pour AMD. Le fondeur proposera dès le lancement des variantes 6 et 8 cœurs de ses processeurs FX : dans le premier cas le processeur sera composé de trois modules Bulldozer, dans le second il embarquera un total de quatre modules. Qui plus est ce design est censé permettre une montée en fréquence facilitée, conformément aux objectifs énoncés plus haut. On se souvient qu'en la matière AMD avait quelques difficultés ces dernières années.
Les 8 coeurs d'un FX 8150 vus par Windows
Au-delà des modules !
Les modules ne sont pas la seule nouveauté de l'architecture Bulldozer, loin s'en faut. C'est ainsi que le front-end évolue lui aussi. Ce bloc, qui assure l'alimentation constante en instructions des unités d'exécutions, est dorénavant partagé entre les cœurs d'un même module. Il a donc été revu en conséquence pour assurer un débit soutenu. Ici les ingénieurs d'AMD ont porté l'essentiel de leur attention sur la gestion des branchements. Rappelons qu'un branchement est ni plus ni moins qu'un saut dans le code. En clair on passe d'un bout de code à un autre si une condition apparaît et l'idée est de prévoir les branchements pour accélérer le préchargement d'instructions ou de données nécessaires à la bonne poursuite du code.C'est ainsi que les pipelines de prédiction et d'alimentation sont dorénavant découplés alors qu'AMD introduit un certain nombre de mécanismes bien connus... chez Intel. On retrouve, pèle-mêle, la gestion des branches directes ou indirectes avec un buffer à deux niveaux, la détection de boucles ou encore la présence d'un Trace cache pour stocker, comme sur Nehalem, les micro-instructions déjà décodées. Au sujet du décodage, l'unité dédiée à cette fonction dans Bulldozer peut traiter jusqu'à 4 instructions par cycle, contre 3 précédemment sur les Phenom.
Gros plan sur le front-end
En ce qui concerne le cache, le module Bulldozer dispose de 64 Ko de mémoire de premier niveau pour les instructions fonctionnant sur deux voies : il est donc partagé entre les cœurs. Chaque cœur embarque par ailleurs son propre cache de premier niveau avec 16 Ko pour les données. Ici le cache L1D est de type associatif à 4 voies. Question performances, ce cache est censé avoir été optimisé avec, entre autres, la mise en place de techniques pour prédire l'emplacement de la voie des données recherchées dans le cache.
Signalons au passage l'arrivée d'une solution de fusion. Comme chez Intel (décidément !) Bulldozer est capable d'effectuer le décodage de plusieurs instructions en une seule instruction : chez AMD on parle de fusion de branche.
Gros plan sur les cœurs !
Du côté des cœurs d'exécution x86 de chaque module Bulldozer, on retrouve un pipeline à 4 étages (contre 3 précédemment). Il est découpé avec d'un côté deux ALU ou unités d'exécution arithmétiques et logiques et 2 AGU ou unités de génération d'adresses. Par rapport à Phenom dont le pipeline 3 étages était composé de trois ALU, un cœur d'exécution Bulldozer ne peut donc exécuter que deux instructions entières par cycle d'horloge contre 3 pour un cœur Phenom. C'est un désavantage théorique qui ne tient pas compte du second cœur d'exécution et qui ne considère pas l'aspect consommation énergétique. Rappelons qu'un module Bulldozer avec ses deux cœurs d'exécution est censé être nettement moins vorace que deux cœurs Phenom.En ce qui concerne le registre, celui-ci profite d'une amélioration significative avec l'arrivée d'un PRF. Là encore l'architecture Sandy Bridge d'Intel nous a récemment familiarisés avec cette notion. Le PRF est une sorte d'index qui relie les registres utilisés par le moteur d'exécution out-of-order à leurs entrées dans la mémoire tampon. L'avantage premier est ici de stocker des entrées de taille supérieure.
Nos deux cœurs d'exécution se partagent une unité centrale en charge des opérations 128 bits. Ladite unité est composée de deux pipelines 128 bits qui peuvent être combinés en une seule unité 256 bits, nous y reviendrons. De type FMAC les pipelines en question peuvent effectuer en une seule passe des opérations de multiplication et d'addition sur des nombres à virgule flottante et ce sans aucun arrondi durant le calcul pour une précision maximale. Une fois unifiées en 256 bits, ces deux unités peuvent alors traiter les instructions AVX au rythme d'une instruction par cycle d'horloge. Le passage à un PRF évoqué plus haut est bien sûr justifié par l'arrivée de la prise en charge AVX.
FPU partagée entre coeurs Bulldozer
Puisque nous évoquions les instructions, il est bon d'ajouter qu'à la prise en charge d'AVX, AMD ajoute la gestion des instructions SSE 4.1 et SSE 4.2. Comme si cela ne suffisait pas, il ajoute aussi ses propres instructions poétiquement nommées XOP et FMA4 sans oublier le CVT16. Il s'agit ici d'instructions complétant l'AVX et issues du projet SSE5 un temps annoncé par AMD mais jamais concrétisé. Le FMA4 (Fuse multiply add) est une instruction qui stocke le résultat d'une opération dans un registre additionnel après avoir effectué en un seul cycle une multiplication et une addition. Intel utilise pour sa part un FMA3 où le résultat de la dite opération est placé dans un registre précédemment utilisé. À ce sujet, le successeur de Bulldozer sera FMA3, rejoignant ainsi le camp Intel. Ces instructions pourraient apporter des gains significatifs dans des applications haute performance (applications de calcul, scientifique, etc.) seulement voilà il y a fort à parier que les compilateurs n'en tirent pas profit, d'autant plus si AMD annonce déjà qu'il abandonne à l'avenir le FMA4 pour le FMA3...
Les instructions prises en charge par Bulldozer
Signalons enfin la gestion de l'AES pour tout ce qui touche aux accélérations matérielles liées aux opérations de cryptage et décryptage utilisant le standard du même nom.
Quid de la mémoire ?
Nous évoquions un peu plus haut l'agencement des caches de premier niveau. Naturellement, l'architecture Bulldozer ne se contente pas de ce seul niveau de cache. C'est ainsi qu'AMD propose un cache de second niveau de type associatif. Agencé sur 16 voies, il est partagé entre les cœurs et sa taille culmine à 2 Mo par module donc.Un troisième niveau de mémoire cache est également au programme avec un maximum de 8 Mo partagés entre tous les modules constituant le processeur. Toujours associatif, le cache L3 dispose de 64 voies. Le troisième niveau de mémoire cache n'est pas inclusif et reprend l'ensemble des données éjectées du cache L2. Au total donc, un processeur FX architecture Bulldozer peut disposer de16 Mo de mémoire cache ! Ce n'est pas rien. En ce qui concerne la latence des caches nous avons relevé 3 cycles pour le L1, 18 pour le L2, ce qui reste très bon et 65 pour le L3. Comme redouté cette dernière valeur est assez élevée. C'est plus en tout cas d'un processeur Core de seconde génération dont la latence du cache L3 est de 57 cycles
Au-delà des caches, l'architecture Bulldozer intègre bien évidemment le contrôleur mémoire. On a droit ici à un contrôleur mémoire DDR3 de type double-canal, chaque canal étant interfacé sur 64 bits avec 8 bits pour la correction d'erreurs. Le contrôleur supporte des fréquences assez élevées. C'est ainsi qu'avec deux barrettes on pourra installer de la DDR3-1866 sur son système opérant en pratique à 933 MHz. Attention, avec quatre barrettes on tombe nécessairement à 800 MHz de fréquence maximale soit de la DDR3-1600. AMD indique par ailleurs prendre en charge une tension d'alimentation de 1,25 volts pour la DDR3.
DDR3-1866 et FX 8150
Gestion de l'énergie et mode Turbo
L'un des maîtres mots ayant présidé à la conception de Bulldozer est son efficacité énergétique. C'est dans cet esprit que les cœurs d'un même module se partagent diverses unités. À ce choix architectural s'ajoutent d'autres améliorations. AMD dit avoir fait progresser les mécanismes de clock-gating et de power-gating à travers la puce qui permettent d'arrêter ou de suspendre certaines zones de la puce en cas d'inactivité. C'est ainsi qu'AMD rejoint Intel en implémentant des mécanismes pour suspendre l'alimentation de certaines portions de la mémoire cache notamment. Pour mémoire Intel le fait depuis... le Pentium M... ça date ! Les modes d'alimentations C1E et C6 font par ailleurs leur apparition et AMD propose un contrôle de l'alimentation de la mémoire DDR.L'autre nouveauté de Bulldozer c'est le retour de la technologie Turbo qui n'était jusqu'alors présente que sur les processeurs Phenom II à six cœurs, les modèles X6. Le Turbo made in AMD nous revient en version 2.0 et opère selon deux niveaux. Le premier est effectif sur tous les cœurs de la puce et offre un surcadencement de 300 Mhz. Le second n'opère que sur la moitié des cœurs de la puce et ajoute aux 300 premiers MHz un niveau supplémentaire de surcadencement, variable en fonction du TDP, ou enveloppe thermique de la puce. Ce mode ne s'enclenche qu'avec des applications faiblement multi-threadées.
Gros plan sur le fonctionnement du Turbo
Northbridge : peu de changements !
Le northbridge intégré à Bulldozer n'évolue finalement qu'assez peu. Il conserve son rôle de contrôleur mémoire, que nous détaillions déjà un peu plus haut et c'est pour ainsi dire sa seule fonction avec la gestion de l'HyperTransport. L'interface de communication du processeur avec le reste du système est en effet ce bon vieil HyperTransport 3.0 avec un lien 16 bits pour un débit de 5,2 GT/s.On retiendra qu'AMD n'intègre toujours pas de contrôleur PCI-Express à ses processeurs haut de gamme, contrairement à l'architecture Sandy Bridge d'Intel.
AMD FX : le processeur, le socket AM3+, la gamme
Pour ce test, AMD nous a fait parvenir l'AMD FX 8150, son nouveau fleuron, connu sous le nom de code Zambezi. Ce processeur FX bénéficie de l'architecture Bulldozer et est gravé pour la première fois chez AMD en 32 nm par le fondeur GlobalFoundries. Avec une surface de die légèrement supérieure à 315 mm² la puce est imposante et compteMise à jour 05 décembre 2011 : AMD a corrigé le décompte officiel de transistors de l'architecture Bulldozer. Sans donner de précision sur les raisons de cette erreur, le nouveau décompte officiel fait été de 1,2 milliard de transistors.
AMD inaugure pour ce lancement un nouveau socket, l'AM3+. Compatible avec l'AM3 (les processeurs FX peuvent être utilisés dans les cartes mères AM3 et inversement), ce socket apporte quelques petites améliorations au niveau des tensions d'alimentation que ce soit pour le lien HyperTransport ou la mémoire. Au sujet de la compatibilité des processeurs FX avec les cartes mères AM3, notez qu'il vous faudra probablement une mise à jour du BIOS pour que le processeur soit reconnu convenablement.
Nouveau socket AM3+
Modèle haut de gamme oblige, le FX 8150 est cadencé à 3,6 GHz en fréquence de base avec un Turbo opérant à 3,9 GHz et un mode Max Turbo à 4,2 GHz. Le TDP de cette puce est annoncé à 125 Watts. On dispose bien sûr de 8 cœurs d'exécution et d'un cache de 8 Mo en L2 et 8 Mo en L3. Et puisque nous sommes en présence d'un processeur FX, le coefficient multiplicateur est débloqué en vue de faciliter l'overclocking.
Le processeur vu par CPU-Z
Au-delà du FX 8150, c'est bien une gamme complète qu'AMD lance aujourd'hui en déclinant ses FX en modèles 6 cœurs, c'est le cas du FX 6100 et en modèle 4 cœurs ! Cadencé à 3,3 GHz, le FX 6100 dispose de 6 Mo de mémoire cache L2 et de 8 Mo de mémoire cache L3 pour un TDP de 95 Watts. On retrouve également le FX 4170 un processeur quadruple cœurs à architecture Bulldozer cadencé à 4,2 GHz, sans Turbo ( ?! ) autre qu'un mode max Turbo à 4,3 GHz pour un TDP de 125 Watts et un cache L2 de 4 Mo contre 8 Mo pour le L3.
La gamme FX annoncée par AMD
Asus Crosshair V Formula
Toujours dans les starting blocks, Asus dégaine à l'occasion de la sortie des processeurs FX, une nouvelle carte mère baptisée Crosshair V Formula. Présentée en juin dernier à l'occasion du Computex, celle-ci adopte le socket AM3+ et reprend les grandes lignes de la Crosshair IV Formula. Au format ATX, avec un PCB noir et des embouts arrondis, la carte est dotée d'un chipset AMD 990 FX avec southbridge SB950.On retrouve quatre emplacements mémoire DDR3 avec une prise en charge de la DDR3-2133 au mieux, des connecteurs d'alimentation ATX 24 broches, ATX 8 broches et un connecteur ATX 4 broches optionnel. L'étage d'alimentation est de type numérique avec un total de dix phases (8+2). Il est refroidi par un radiateur usiné aux couleurs de la gamme Republic of Gamers d'Asus et parcouru par un caloduc.
Carte mère AMD Crosshair V Formula
Avec quatre connecteurs PCI-Express 2.0 16x, dont deux câblés sur 16x, un sur 8x et le dernier sur 4x, la carte est compatible NVIDIA SLI (y compris 3-Way SLI) et CrossFireX. On a également droit à un connecteur PCI-Express 1x et un slot PCI.
Du côté du Serial-ATA, Asus est pingre : seulement six connecteurs en SATA 6 Gb/s et un septième en bonus dépendant d'un contrôleur Asmedia. L'USB 3.0 est bien sûr au rendez-vous avec deux contrôleurs Asmedia dédiés. Il est amusant de constater que le réseau est ici géré par un contrôleur Gigabit Intel, amusant car sur une plate-forme AMD c'est avouons-le peu courant. Le codec audio est un Realtek ALC889 avec une couche logicielle Sound Blaster X-Fi.
Niveau connectique extérieure on retrouve quatre ports USB 3.0 (à noter un connecteur 19 broches sur la carte mère pour relier deux ports USB 3.0 additionnels présents sur son boîtier), 8 ports USB 2.0, un connecteur RJ45, un port eSATA, une sortie optique, et une rampe de six connecteurs audio mini-jack. Comme souvent chez Asus on a droit à un bouton de Clear CMOS à l'arrière de la carte mère. À même la carte nous avons droit à un bouton de mise en marche, un bouton reset et un bouton overclocking. La fonction ROG Connect qui permet de connecter en USB un netbook Asus pour contrôler le BIOS peut ici être désactivée via un commutateur soudée à même le PCB de la carte.
Quelques mots enfin sur le BIOS qui est de type UEFI ! On retrouve les traditionnelles options des BIOS Asus avec quelques réglages intéressants. La possibilité de jouer sur le coefficient multiplicateur, de modifier la fréquence du bus système, d'ajuster les tensions des divers composants de la carte mère avec moult sous réglages dans ce domaine ou encore une fonction pour désactiver la technologie Turbo Core d'AMD. Du reste, pour les amateurs d'overclocking, Asus propose un préréglage baptisé « Extreme overclocking », celui-ci désactive un ensemble de réglages BIOS comme le plein écran, mais va également plus loin en désactivant les contrôleurs additionnels de la carte dont l'USB 3.0 et le contrôleur réseau ! Tout de même !
Pour tester les performances des nouveaux FX d'AMD, nous avons utilisé la plateforme suivante :
- Carte mère Asus Crosshair V Formula (BIOS 9905),
- 4 Go mémoire DDR3-1866 Kingston @933 MHz
- SSD Samsung 830 256 Go + Western Digital Raptor 300 Go
- Carte graphique NVIDIA GeForce GTX 570
- Carte mère Asus Crosshair IV Formula (BIOS 1902)
- 4 Go mémoire DDR3-1600 Corsair @1333 MHz
- SSD Samsung 830 256 Go + Western Digital Raptor 300 Go
- Carte graphique NVIDIA GeForce GTX 570
- Carte mère Asus F1A75-V PRO
- 4 Go mémoire DDR3-1600 Corsair @1333 MHz
- SSD Samsung 830 256 Go + Western Digital Raptor 300 Go
- Carte graphique NVIDIA GeForce GTX 570
- Carte mère Asus Maximus IV Extreme
- 4 Go mémoire DDR3-1600 Corsair @1333 MHz
- SSD Samsung 830 256 Go + Western Digital Raptor 300 Go
- Carte graphique NVIDIA GeForce GTX 570
- Carte mère Asus Rampage III Black Edition
- 6 Go mémoire DDR3-1600 Corsair @1333 MHz
- SSD Samsung 830 256 Go + Western Digital Raptor 300 Go
- Carte graphique NVIDIA GeForce GTX 570
3DMark Vantage - v1.0.1 - Test processeur
On démarre avec ce bon vieux 3DMark. Sans grande surprise nous retrouvons Westmere en tête avec le Core i7 990X. Sandy Bridge, ici représenté notamment par le Core i7 2600K arrive en deuxième position. Quant au Core i5 2500K, il devance de peu Bulldozer et le FX-8150 d'AMD. Avouons qu'avec huit cœurs à son actif, nous attendions mieux du dernier-né d'AMD. Il reste toutefois plus rapide qu'un Core i5 2400 et devance les Phenom II qu'ils soient X4 ou X6.
PCMark 7
Récemment sorti en version 7.0, PCMark est un outil de test synthétique. En tête nous retrouvons les processeurs Core. Les Sandy Bridge font légèrement mieux que le dernier représentant de la plate-forme LGA1366, le Core i7 990X. Quant au petit dernier d'AMD il termine cinquième, derrière le Core i5 2400. Ce dernier se montre 15% plus rapide que le FX 8150. Quant à Bulldozer il dépasse d'une tête le Phenom II X4 980.
Sandra 2011 - Test processeur
Le test processeur de Sandra 2011 est un plébiscite pour le Core i7 990X dont les six cœurs sont en pôle position. On aurait pu attendre du FX 8150 des performances supérieures du fait de ses huit cœurs, mais il n'en est rien. Pire, les quatre cœurs du Core i7 2600K font largement mieux. Cela confirme du reste les choix architecturaux opérés par AMD : alors que les architectures Intel sont pensées pour délivrer le plus grand nombre d'instructions par seconde ou de flottant, Bulldozer est avant tout pensé pour monter en fréquence. Du coup, avec ses huit cœurs, le FX 8150 arrive tout juste à dépasser les quatre cœurs d'un Core i5 2400... À noter toutefois que les performances de Bulldozer sont supérieures aux Phenom II X6 et X4, c'est déjà ça !
Sandra 2011 - Test mémoire
Du côté des performances mémoire, Sandra place cette fois le FX 8150 en pôle position. Il faut dire que nous utilisons le dernier processeur d'AMD avec de la DDR3-1866 quand les autres plate-formes opèrent avec de la DDR3-1333 (bien souvent leur spécification maximale). Il est intéressant de constater que deux canaux en 1866 font ici mieux que trois canaux en DDR3-1333 pour le Core i7 990X.
ScienceMark 2.0 x64 - Primordia
ScienceMark évalue nos processeurs en fonction de leur rapidité à effectuer certains calculs avancés. En tête, les Sandy Bridge rayonnent. Le Core i7 990X d'Intel termine même troisième derrière les Core i7 2600K et Core i5 2500K. Du haut de ses 3,3 GHz (hors Turbo), le Core i5 2500K se montre 18% plus véloce que le Phenom II X4 980, l'ancienne référence haut de gamme d'AMD. Plus surprenant, le FX 8150 ne fait pas mieux... Bien au contraire... Il termine avant-dernier, un cran au-dessus du A8-3850, le processeur avec solution graphique intégré d'AMD (nom de code Llano).
Cinebench 11.5
Cinebench effectue le rendu d'une scène 3D complexe pour mettre à l'épreuve nos processeurs. Massivement multi-threadé, le test propulse Westmere et notre Core i7 990X en première position. Le Core i7 2600K termine second quant au FX 8150, il est troisième avec des performances un cheveu supérieures à celles du Core i5 2500K. Face au Phenom II X6 1100T, la comparaison fait mal... puisque les six cœurs de l'ancien Phenom font quasiment aussi bien que les huits cœurs de Bulldozer.
Reste que le FX 8150 est ici 10% plus rapide que le Core i5 2400 alors qu'il se montre 38% plus performance que le Phenom II X4 980.
Compression de fichiers - WinRAR 4.01
Le test de compression de fichiers est assez simple : nous générons une archive depuis notre SSD vers un disque dur Serial-ATA plus conventionnel. Nous mesurons le temps nécessaire à la réalisation de l'opération. Les résultats sont exprimés en secondes, la barre la plus courte représente le processeur le plus rapide. À ce petit jeu, le Core i7 990X tire son épingle du jeu (à noter pour cette plate-forme l'utilisation du contrôleur Serial-ATA 6 Gb/s intégré à la carte mère pour notre SSD Samsung) et s'avère le plus rapide. Core i7 2600K et Core i5 2500K ne sont pas loin alors que le FX 8150 fait aussi bien qu'un Core i5 2500K. Pour une fois le résultat est appréciable. Face à un Phenom II X4 980, on gagne tout de même 36 secondes sur notre temps d'encodage ! À noter les piètres performances de Llano et du A8 3850.
3DSMax 2010 - 1280*1024 - Radiosité
Logiciel professionnel, 3DSMax est ici utilisé pour effectuer le rendu d'une scène 3D. Nous relevons le temps nécessaire au calcul de notre scène. Là aussi, les résultats sont exprimés en secondes, la barre la plus courte représentant le processeur le plus rapide. Intel domine une fois encore : Sandy Bridge et Westmere sont en tête, et pas qu'un peu, alors que le FX 8150 est à la traîne. Il est ici plus lent que le Phenom II X6 1100T, mais un tantinet plus rapide que le Phenom II X4 980. Bref, autant le FX 8150 était convaincant sous WinRAR, autant sous 3DSMax il fait peine à voir.
Adobe Photoshop CS5 - Flou radial
Point n'est besoin de présenter Photoshop. Avec ce logiciel nous mesurons, chronomètre en main, le temps d'application d'un filtre sur une image haute résolution. La lecture du graphique est inversée, les scores étant exprimés en secondes. La barre la plus courte représente le processeur le plus rapide et ce titre revient au Core i7 990X qui devance le Core i7 2600K. Le FX 8150 termine ici troisième à égalité avec le Core i5 2500K. On notera que le Phenom II X4 980 est deux fois plus lent lors de l'application de notre filtre de référence que le nouveau FX 8150.
Compression vidéo - TMPGenc 4.7
Sous TMPGenc nous mesurons le temps nécessaire à effectuer la compression au format MPEG2 d'une vidéo de référence. Le résultat est indiqué en secondes et la barre la plus courte représente le processeur le plus rapide. Pas de vraie surprise ici, les processeurs Core sont les plus rapides... de loin. Notre FX 8150 et ses huit cœurs font aussi bien qu'un Phenom II X6 1100T. Face à un Core i5 2500K, il faudra donc 17 secondes de plus pour venir à bout du même encodage sur Bulldozer.
Mathematica 5.2
Mathematica, bien connu des étudiants des filières scientifiques notamment, nous propose d'évaluer les performances de nos processeurs en fonction de leur rapidité à effectuer certains calculs. L'architecture Sandy Bridge s'envole littéralement, ces trois représentants terminant sur les trois premières marches du podium. Le Core i7 990X est quatrième, devant le FX 8150 qui termine donc cinquième. Si le dernier joujou d'AMD est 16% plus rapide que le Phenom II X4 980 il n'est hélas pas capable de rivaliser avec un Core i5 2400.L'intégralité de nos tests de performances en jeu sont effectués dans une résolution d'affichage volontairement faible. Le but ici est de mettre en avant les différences de performances d'un processeur à l'autre et non de tester les capacités de notre carte graphique.
Crysis Warhead - v1.1 - 1024x768x32 - Réglages élevés
Crysis fait la part belle à Intel. Les processeurs du fondeur de Santa-Clara ont un avantage considérable et les Core i7 2600K et Core i7 990X trustent le haut du classement. Outre l'écart Intel/AMD qui atteint 49% entre le Core i5 2500K et le FX 8150, on retient que le Phenom II X4 980 est 7% plus rapide que le FX 8150 ! Ce dernier est à égalité avec un Phenom II X6 1100T.
Dirt 3 - 1024x768x32 - Réglages Ultra
Pour le jeu de courses DiRT 3, qui profite de DirectX 11, le processeur le plus rapide est le Core i7 990X. Les Sandy Bridge signent de très bon scores et le FX 8150 se montre le plus rapide des processeurs AMD. Reste un souci... l'écart entre Core i5 2500K et FX 8150 grimpe tout de même à 46%. À noter les bonnes performances du FX 8150 face à ses comparses AMD puisqu'il se montre le plus rapide.
Call Of Duty 4 Modern Warfare - v1.7 - 1024x768x32
Pour ce bon vieux Call Of Duty 4, le Core i7 990X reste le processeur de choix. Un processeur largement plus véloce que le nouveau FX 8150. Ce dernier signe des performances inférieures aux Phenom II X4 980 et Phenom II X6 1100T. Du coup, le Core i5 2500K se 47% plus rapide...
Far Cry 2 - v1.04 - 1024x768x32
On termine les tests jeux avec Far Cry 2. À l'image de ce nous observions par ailleurs, les processeurs AMD marquent le pas face à l'offre d'Intel. Quant au FX 8150 il ne parvient pas à devancer le Phenom II X4 980 qui reste plus véloce.Comme à chaque nouvelle architecture ou plate-forme, nous nous intéressons à certaines combinaisons ou particularités afin de mettre en avant leur intérêt potentiel. Bulldozer n'échappe pas à la règle !
Quid de la fréquence DDR ?
Nous l'indiquions précédemment, Bulldozer dispose d'un contrôleur mémoire capable d'opérer avec de la DDR3-1866. Nous avons donc exécuté notre protocole de test dans son intégralité avec de la DDR3-1866 puis avec de la DDR3-1333 plus conventionnelle pour mettre en lumière un éventuel écart de performance. Afin de conserver un graphique à peu près lisible, nous avons sorti des tests les benchmarks dont les scores s'expriment selon l'échelle des milliers.Comme on peut le voir, l'avantage conféré par la DDR3-1866 face à de la DDR3-1333 est minime. C'est finalement Sandra 2011 qui affiche l'écart le plus net, la mesure de bande passante étant forcément plus élevée en DDR3-1866. L'impact dans la vie réelle est hélas tout autre. Ainsi Photoshop, Cinebench, 3DSMax 2010 n'en bénéficient pas notamment. Alors que pour Far Cry 2, le gain de performances apporté par la DDR3-1866 est de 4,6% face à la DDR3-1333.
Quel apport de Turbo Core ?
Le FX 8150 dispose de la technologie Turbo Core. Rappelons que cette dernière augmente automatiquement la fréquence de fonctionnement des coeurs en fonction de la charge et de la marge disponible en terme d'enveloppe thermique. Nous avons cherché à mesurer son impact sur les performances en procédant à deux séries de tests : avec et sans Turbo Core.Fort logiquement Turbo Core affecte bien plus les performances que le type de mémoire employé. Si Photoshop y est insensible, les jeux montrent de vrais gains intéressants ! De 3% sous Dirt 3 et Crysis jusqu'à 15% pour Call Of Duty 4 ! L'apport de Turbo Core sur les performances de Bulldozer n'est donc pas négligeable, loin s'en faut.
Consommation
Nous avons bien sûr mesuré la consommation électrique de nos processeurs. Pour cela nous employons un wattmètre et nous relevons la consommation électrique du système à la prise. C'est donc la consommation totale de la machine qui est relevée. Nous procédons à deux mesures : au repos sous Windows 7, puis en charge avec Prime 95.Au repos le FX 8150 consomme autant qu'un système Sandy Bridge et nettement moins que les anciennes plate-formes Phenom II. C'est donc un joli progrès. En charge en revanche, notre système FX 8150 engloutit 277 Watts : c'est au bas mot 70 Watts de plus que les meilleurs Sandy Bridge, une quarantaine de Watts de plus que les Phenom II et presqu'autant que notre Core i7 990X de référence, qui ne brillait pas spécialement de ce côté là.
Température
Nous avons cherché à connaître l'échauffement de notre FX 8150 versus ses petits camarades. Cet exercice est délicat à plus d'un titre à commencer par le fait que nous ne disposons pas d'une pièce à température constante. A défaut d'être scientifiquement inattaquable notre relevé de températures nous donne quelques indices. Nous utilisons pour le refroidissement le ventirad de référence AMD et le ventirad de référence Intel alors que les valeurs relevées sont celles remontées par les sondes de nos cartes mères sous Windows. Nous procédons à deux relevés, l'un au repos après 10 minutes d'inactivité, l'autre en charge sous Prime 95 passé le même délai.Au repos, notre Core i7 2600K est le processeur le plus froid. A noter une température convenable pour le FX 8150 du niveau du Phenom II X4 980. En charge on s'aperçoit que c'est le Phenom II X4 980 qui s'échauffe le moins suivi du Core i7 2600K. La température relevée pour notre FX 8150 s'envole et dépasse les 60° C ! Nous avons relevé 62° C avec des pics à 67° C. C'est beaucoup... Et c'est plus que Llano et que le Phenom II X6 1100T.
Overclocking
L'architecture Bulldozer ayant été conçue pour monter en fréquence, l'overclocking est bien sûr un paramètre important. Le FX 8150 étant un processeur débloqué, nous avons tenté de vérifier ses aptitudes. À noter qu'à l'inverse de Sandy Bridge, il n'y a pas de considérations à avoir en tête avec Bulldozer sur le chipset à utiliser ou le modèle de processeur à choisir dans le but d'overclocker sa machine. Le bus système, fixé par défaut à 200 MHz reste overclockable, en plus bien sûr de la possibilité de jouer sur le coefficient multiplicateur. Cadencé par défaut à 3,6 GHz, notre FX 8150 a atteint sans broncher les 4,4 GHz, en air cooling en changeant simplement le coefficient multiplicateur : de 18 à 22. Un cran de plus et les 4,6 GHz furent atteint sans souci.AMD FX 8150 : essais d'overclocking, 4,6 GHz puis 4,8 GHz
Pour aller plus haut nous avons du réhausser la tension CPU à 1,48v. C'est ainsi que nous avons pu atteindre les 4,8 GHz avec un coefficient multiplicateur de 24x et un bus système à 200 MHz. En air-cooling et avec un simple réglage du BIOS on gagne donc 1,2 GHz sur la fréquence de base. Pas mal ! Reste que nous avons tenté d'aller plus haut... sans succès hélas. Malgré plusieurs tentatives, différentes approches, moult réglages, les 5 GHz sont restés hors d'atteinte pour notre processeur. Néanmoins nous avons déjà que plusieurs confrères ont eu plus de chance que nous avec des échantillons tolérant les 5 GHz.
Conclusion
C'est non sans un certain retard qu'AMD réussit à finalement nous proposer ses nouveaux processeurs haut de gamme. Annoncée de longue date, l'architecture Bulldozer commençait à se faire plus que désirer alors qu'en face Intel semble ne pas connaître de repos. Plusieurs années après Phenom, l'ex-fondeur de Sunnyvale nous propose donc enfin une nouvelle micro-architecture. En cela, nous saluons bien évidemment l'arrivée de Bulldozer qui a le mérite de sérieusement moderniser l'offre d'AMD et de rattraper de facto le retard pris face à Intel.
Sur le papier, l'architecture Bulldozer est plus qu'intéressante. Même si à priori favoriser la montée en fréquence au détriment de l'IPC, c'est-à-dire du nombre d'instructions traitées par cycle d'horloge, n'était plus franchement à la mode après les déboires connus par Intel avec ses Pentium 4. Le cheminement d'AMD force toutefois le respect car non content de s'inscrire à contre-courant de son principal concurrent, les ingénieurs de la firme ont apporté des optimisations plutôt bien vues : le concept de partage des ressources et de mutualisation d'unités est intéressant tant sur le plan de la consommation énergétique que de l'occupation de l'espace en terme de transistors. De plus, l'idée de module permet une grande... modularité qui va autoriser AMD à multiplier les déclinaisons 4, 6 ou 8 cœurs.
Seulement voilà. La théorie se heurte à la pratique et cela fait mal. AMD a beau aligner les cœurs, jusqu'à 8 cœurs dans son modèle haut de gamme le FX 8150, les performances ne sont pas là. Et pour cause les cœurs en question sont atrophiés... la performance en simple thread n'étant pas là, multiplier les coeurs n'est pas vraiment profitable.Il n'est pas dit non plus qu'en cette fin d'année 2011, l'utilisateur même avancé ait réellement besoin de huit cœurs. A cela s'ajoutent une consommation électrique inquiétante, un échauffement préoccupant et une surface de die anormalement élevée alors même que l'un des buts de Bulldozer était justement de réduire la taille de la puce. Bref les choix d'AMD ne semblent pas couronnés de succès et si l'architecture Bulldozer est conçue pour monter en fréquence on se demande finalement pourquoi le porte-étendard de la marque est limité à 3,6 GHz de base ?
Une comparaison avec le Pentium 4 s'impose d'ailleurs... Certains attributs de Bulldozer nous rappellent en effet l'architecture Netburst d'Intel. Un processeur qui s'échauffe, consomme mais peine à offrir des performances dignes de ce nom... C'est du déjà vu ! Et encore à l'époque le Pentium 4 avait l'avantage d'afficher une fréquence bien supérieure à ses concurrents AMD les plus directs. Mais avec Bulldozer ce n'est hélas pas le cas.
Certes la plate-forme AMD, nom de code Scorpius, est plus simple que celle d'Intel : pas de choix cornélien entre P67, H67 ou maintenant Z68 alors que l'on trouve des cartes mères abordables autour de la centaine d'euros. Et certes encore, en overclocking les processeurs FX vont haut voire très haut... Mais à quoi bon ? Les overclockers y trouveront indéniablement leur compte, mais il n'en demeure pas moins que le FX 8150 n'est pas capable de rivaliser avec un Core i7 2600K sorti début janvier et qu'il faut le comparer aux Core i5 d'Intel. Cruel aveu. Triste déception. Et que dire lorsque dans les jeux un Phenom II fait mieux que le nouveau venu ?
Alors la bonne nouvelle dans tout cela c'est que finalement les nouveaux processeurs FX seront abordables. Mais abordables dans quel contexte ? Abordables face à un Core i7 Extreme Edition... mais pas nécessairement par rapport à un Core i5 2500K... qui se négocie autour des 190 euros quand le FX 8150 est attendu autour des 245 euros. Bref... Il faudra attendre pour voir comment AMD fait évoluer son offre mais Bulldozer ne va pas faire table rase de la concurrence, ni même la terrasser, l'offre d'Intel restant aujourd'hui encore la mieux placée. D'autant que niveau disponibilité, il semblerait que les stocks ne soient pas au rendez-vous pour ce lancement.