Un processeur Lunar Lake Core Ultra 200V © Intel
Un processeur Lunar Lake Core Ultra 200V © Intel

À l’occasion du Computex 2024 de Taipei, Intel a levé le voile sur la génération Lunar Lake, cette nouvelle gamme de processeurs prévue pour le monde du laptop et qui doit – déjà – faire oublier Meteor Lake pourtant âgée de moins d’un an. Révolution technique ou feu de paille ?

Introduction

Le nom de code Lunar Lake ne devrait plus être tellement utilisée par Intel qui parle de Core Ultra 200V, sa nouvelle génération de processeurs mobiles avant tout destinés aux ordinateurs portables. Pour l’heure, nous n’avons pas été en mesure d’essayer de portable ainsi équipé, mais Intel nous a convié à Taïwan pour découvrir son architecture, innovante sur pas mal de points.

Intel mise gros avec Lunar Lake  © Intel
Intel mise gros avec Lunar Lake © Intel

Il a déjà été précisé qu’avec Lunar Lake, Intel a décidé de remiser la technologie hyper-threading. Nous savions aussi que cette nouvelle génération serait l’occasion d’un étroit partenariat avec TSMC, pourtant l’un des principaux concurrents « fonderie » d’Intel. Lunar Lake signe également l’intégration d’un NPU – puce dédiée à l’IA – plus costaud que jamais et marque le renouveau des cœurs performants, autant qu’efficaces.

De la conception de la puce : RAM intégrée

À la base d’une puce Lunar Lake, on (re)trouve le procédé Foveros qui vient – comme sur Meteor Lake – réunir les différentes « unités » qu’Intel souhaite regrouper pour concevoir ses processeurs. « Unité », le terme est impropre puisqu’Intel parle de tile, mais la traduction tuile n’est pas non plus vraiment satisfaisante.

Une construction complexe © Intel

Foveros vient donc associer sur sa base tile, trois autres unités. La compute tile dédiée aux calculs purs et rassemblant aussi bien les cœurs Lunar Cove/Skymont que les cœurs graphiques, le NPU ou le contrôleur mémoire. Il y a aussi la platform tile laquelle se focalise sur tout ce qui est entrées/sorties et les différentes connectique (Wi-Fi, Bluetooth, Thunderbolt). Enfin, une filer tile complète le tout : il s’agit d’un espace « vide » dont le but est d’équilibrer la puce.

Là où les choses sont intéressantes, c’est quand Intel détaille la provenance des unités d’un Lunar Lake. En effet, la compute tile est fabriquée par TSMC et gravée selon le procédé N3B tandis que la platform tile est… toujours fabriquée par TSMC, via le procédé N6. Si la conception est américaine, la production de Lunar Lake est en grande partie taïwanaise… même si l’assemblage finale via Foveros se fera ailleurs, en Malaisie par exemple.

La LPDDR5X intégrée au processeur © Intel

Enfin, un processeur Lunar Lake se distingue des précédentes puces Intel par l’intégration de la mémoire vive… à la manière de ce peut faire Apple sur ses M1, M2, M3. Dans le cas présent, on parle de deux puces qui autorisent un maximum de 32 Go de RAM via deux banques. La mémoire est en LPDDR5X-8500 et cette intégration doit permettre, selon Intel, de gagner en consommation tout en préservant de la place sur la carte mère du PC.

Lion Cove : cœurs performants sans hyper-threading

Un processeur Lunar Lake Core Ultra 200V est conçu autour de quatre cœurs d’un genre nouveau, les Lion Cove. Premier point à souligner – et Intel ne cherche pas à noyer le poisson – Lion Cove fait donc une croix sur l’hyper-threading, une technologie pourtant largement mise en avant jusqu’à présent. Intel explique ce retrait par le besoin de limiter la consommation électrique (objectif premier de Lunar Lake) et par le fait que dans l’immense majorité des cas, les usagers n’ont pas besoin de plus de 4 threads actives pour une seule application.

Diagramme et objectifs des cœurs Lion Cove © Intel

C’est d’ailleurs aussi pour cette raison que « seulement » quatre cœurs Lion Cove seront intégrés aux Core Ultra 200V les plus musclés. Quatre cœurs qui profitent d’une amélioration substantielle de l’IPC, 14 % de mieux par rapport aux Redwood Cove de Meteor Lake si l’on en croit Intel. Des gains obtenus via de multiples améliorations parmi lesquelles on peut citer un bloc de prédiction de branche jusqu’à 8x plus important, une puissance de calcul maximale de 48 FLOP par cycle en FP32 et une refonte de la gestion du cache.

Lion Cove botte les fesses de Redwood Cove © Intel

Intel évoque ici l’introduction d’un cache intermédiaire de 48 Ko, baptisé L0D alors que le cache L1 passe de 48 Ko sur Redwood Cove à 192 Ko ici et que le cache L2 est de 2,5 (Lunar Lake) ou 3 Mo (Arrow Lake) par cœur selon les besoins d’Intel. Enfin, et ce n’est pas anodin non plus, Intel évoque une gestion plus fine des fréquences d’horloge : on ne fonctionne plus par pas de 100 MHz, mais de 16,67 MHz, sachant que les variations sont maintenant gérées par l’IA.

Skymont : la vraie révolution des cœurs efficaces

Limitation à 4 cœurs, fin de l’hyper-threading, les cœurs Lion Cove marquent des chargements sur Redwood Cove, mais ils ne sont clairement pas la star de Lunar Lake. Non, pour Intel, ce sont les cœurs Skymont, les « efficaces », qui font la singularité de la nouvelle génération. Souvent, ces cœurs efficaces étaient vus comme un moyen de gonfler le nombre de cœurs intégrés aux puces et on doutait de leur impact. Avec Alder Lake, Intel a prouvé que ces E-cores avaient leur mot à dire.

Diagramme et objectifs des cœurs Skymont © Intel

Lunar Lake se propose d’accentuer encore l’importance des cœurs efficaces avec ces Skymont qui progressent sur de multiples points. En premier lieu, Intel insiste sur la prédiction de branche qui peut aller jusqu’à 128 octets et un maximum de 96 instructions peuvent être cherchées en parallèle. Sans trop entrer dans les détails, notons aussi qu’Intel a fait des efforts pour limiter la sérialisation des tâches alors que le sous-système mémoire profite aussi de nombreuses améliorations.

Comparaisons pas évidentes sur les diapos officielles © Intel

Le cache L2 est doublé pour atteindre 4 Mo partagé entre les quatre cœurs Skymont, la bande passante double, à 128 octets par cycle, et il devient possible de réaliser des transferts L1 to L1 entre les cœurs. Au final, si Intel semble satisfait des progrès réalisés sur Skymont, il nous est difficile d’en percevoir la portée, la faute à des comparaisons pas très heureuses : par exemple, en multithread, Intel oppose les 4 cœurs Skymont aux 2 LP Cores de Meteor Lake. Tant pis, nous jugerons sur pièces.

Thread Director fait peau neuve

Pour accompagner la « révolution » des cœurs performants et efficaces, Intel a largement retravaillé la partie gestion des threads. La firme se base toujours sur l’Intel Thread Director introduit avec Alder Lake, mais il y a bien des changements. Il s’agit sans doute d’une des parties les plus délicates à appréhender pour les profanes. Faisons simple.

L'attribution des processus est la clé de bonnes performances © Intel

L’objectif de Thread Director est de prendre les processus logiciels et de les associés aux cœurs matériels de la puce afin que l’ensemble fonctionne du mieux possible, que l’on obtienne les meilleures performances tout en limitant la consommation, un objectif clé sur Lunar Lake. Pour ce faire, Intel a décidé de répartir les processus en quatre catégories en fonction de leur nature. À partir de là, une estimation de l’IPC permet de les attribuer aux cœurs les plus adéquats avec, toutefois, la possibilité d’enfermer un processus à une zone afin d’éviter des erreurs d’attribution.

Confinement, enfermement d'un processus © Intel

De plus, avec Lunar Lake, un système de gear est mis en place. L’idée est cette fois de catégoriser l’ordinateur portable afin qu’une espèce de profil lui soit attribué. En fonction de ce gear, la prise en charge de l’alimentation – donc de la puissance et de la consommation – du CPU sera modifiée. Thread Director aura alors davantage tendance à confier les processus aux cœurs performants pour plus de puissance, mais une moindre autonomie. Comme toujours, question d’équilibre.

Xe2 Cores : Battlemage dope l’iGPU

À côté des nouveaux cœurs Lion Cove et Skymont, la grande nouveauté – annoncée en tout cas – pour Lunar Lake est l’introduction de cœurs graphiques Battlemage, les Xe2 Cores. Bien sûr, Intel entend distribuer des cartes graphiques dédiées en Battlemage pour faire suite à son retour sur ce marché avec les cartes Alchemist. Ces cartes n’arriveront cependant qu’après Lunar Lake, laquelle fait donc bien office de précurseur pour cette nouvelle architecture graphique.

Diagramme de l'iGPU Lunar Lake © Intel

Intel évoque d’emblée des gains de 50% par rapport à l’iGPU de Meteor Lake. Pour ce faire, Intel s’appuie sur les 8 Xe2 Cores et, par exemple, l’introduction du XMX ou Matrix Extension Engine qui doit lui offrir 67 TOPS de performance en intelligence artificielle. Plus important, Intel a clairement revu sa position : il n’est plus question d’offrir une puce « compatible DirectX », mais de se mettre au niveau des spécifications DirectX 12 Ultimate… comme les petits copains d’AMD et de NVIDIA, avec moins de bugs graphiques à la clé.

Performances et efficacités : de belles promesses © Intel

Afin de faire bonne mesure, Intel annonce aussi des améliorations au niveau des vector engines (8x 512-bit) et une meilleure gestion de la partie rendu pour une augmentation substantielle des débits. Enfin, le ray tracing étant plus que jamais à la mode, Intel souligne une meilleure prise en charge via l’introduction d’une nouvelle unité de calcul dédiée. Bien sûr, là encore, il nous faudra juger sur pièces avec une belle panoplie de jeux.

NPU 4 : parce que l’IA est incontournable

AMD mettant largement en avant ses unités de calcul dédiées à l’intelligence artificielle, Microsoft ayant elle-même insisté sur l’IA avec son système Copilot+ et l’introduction d’une nouvelle famille de PC, Intel ne pouvait être en reste. NPU 4, pour la quatrième génération de NPU Intel, est là pour apporter la réponse la plus crédible possible.

Détails des améliorations du NPU et estimations des performances © Intel

On se retrouve ici avec 6 cœurs (Neural Compute Engine) conçus pour ce type de calculs quand ils n’étaient que 2 sur Meteor Lake et qu’Intel associent à 12 DSP baptisés SHAVE pour Streaming Hybrid Architecture Vector Engine ainsi qu’à un cache boosté d’au maximum 9 Mo. L’un dans l’autre et même s’il est encore difficile de déterminer la portée exacte de telles améliorations, Intel avance qu’elle double les performances – à consommation égale – par rapport à la génération précédente.

La platform tile et la connectivité

Avant de conclure sur ce qui reste une vision encore un peu théorique de Lunar Lake, il nous faut nous attarder au moins quelques instants sur la platform tile. Nous n’avons pas pour objectif de détailler tous les aspects de Lunar Lake, mais cette unité est le complément indispensable de la compute tile, c’est elle qui fait basculer le processeur vers une connectique plus moderne, notamment sur le sans-fil.

Intégration Wi-Fi 7 : une première pour Intel © Intel

Ainsi, Intel a intégré un contrôleur capable de prendre en charge à la fois le Wi-Fi 7 et le Bluetooth 5.4. Largement mis en avant par Intel, le Thunderbolt 4 est aussi de la partie avec un maximum de trois ports 40 Gbps. La platform tile est aussi le siège du PCI-Express avec 8 lignes PCIe dont 4 sont en Gen 5 et 4 en Gen 4. Lunar Lake n’était pas prévu pour les cartes graphiques dédiées, ces ligne PCIe Gen 5 sont pensées pour les SSD.

Le Thunderbolt 4 est largement mis en avant © Intel

Enfin, parce que l’USB a encore de l’importance au-delà du seul Thunderbolt 4, Intel affirme la prise en charge des USB 3.2 en 5 et 10 Gbps. Il est d’ailleurs amusant de noter qu’Intel souhaite un affichage aussi clair que possible de la nature de tous les ports, histoire d’éviter de prendre de l’USB 3.2 pour du Thunderbolt 4 et inversement.

Lunar Lake : la révolution attendue ?

Pour être tout à fait honnête, nous serions bien en peine de tirer de franches conclusions de ces innombrables présentations réalisées par Intel pour nous convaincre du bien-fondé de cette nouvelle génération. Sur le papier, Lunar Lake marque de multiples avancées et confirme les modifications amorcées avec Meteor Lake.

Récapitulatif des caractéristiques de Lunar Lake © Intel

Entre l’apport de cœurs efficaces largement boostés et de Xe2 Cores Battlemage qui devraient joyeusement massacrer les cœurs Alchemist, Intel semble cocher toutes les cases. Mais voilà, si ces présentations plantent le décor, elles n’ont pas été accompagnées de véritables indicateurs de performances. Quelques évocations, mais pas de mesures « réelles ».

Attendons donc les portables Lunar Lake pour juger des performances globales de la puce. Toutefois, en faisant confiance à TSMC pour la gravure des cœurs, en embrassant la conception chiplet et revenant sur une technologie éprouvée comme l’hyper-threading, Intel montre qu’elle n’hésite plus à se remettre en question, et ça, c’est plutôt bon signe.