Maison connectée parMeilleur VPNSoldesMeilleur AntivirusMeilleur climatiseurForfaits mobiles

Après avoir poussé l'IA partout, Microsoft demande désormais de l'utiliser moins

Publié le 14 juin 2026 à 07h00

Suivez-nous Ajoutez-nous en favori Google

Satya Nadella, directeur général de Microsoft, a admis en juin 2026 que ses équipes abusent des modèles d’IA les plus puissants pour des tâches banales. Le phénomène s’appelle le tokenmaxxing. Microsoft y a répondu non pas en coupant les accès à l’IA, mais en imposant une discipline de coût interne.

Le patron de Microsoft demande à ses employés de lever le pied sur l'usage de l'IA - ©drserg / Shutterstock

Au cours d’un podcast, on a demandé à Satya Nadella si le tokenmaxxing se pratiquait chez Microsoft. « Beaucoup », a répondu le dirigeant, avant même la fin de la question. Le tokenmaxxing désigne le fait de router chaque requête vers le modèle d’IA le plus coûteux, quelle que soit la complexité de la tâche.

Microsoft prévoyait déjà 190 milliards de dollars d’investissement en infrastructure IA sur l’année civile 2026, soit environ 174 milliards d’euros, selon la directrice financière Amy Hood. Quand les employés sollicitent sans distinction les modèles les plus puissants pour reformuler un e-mail ou résumer une réunion, chaque token superflu s’additionne à cette note déjà lourde.

Microsoft interdit à ses ingénieurs de solliciter les modèles d’IA les plus puissants pour des tâches banales

Satya Nadella a choisi l’aveu plutôt que la réprimande. « Je suis un tokenmaxxeur moi-même, c'est addictif », a-t-il déclaré devant le public du podcast. Il a enchaîné sur la consigne concrète : « N'utilisez pas des modèles avancés pour des problèmes non-avancés ». Car ces modèles au sommet de la hiérarchie facturent bien plus par token que leurs équivalents allégés, pour des résultats souvent identiques sur des requêtes simples.

Microsoft ne coupe pas les accès. Le directeur général a orienté ses équipes vers le mode Auto de Microsoft Copilot, qui sélectionne lui-même le modèle adapté à chaque requête, sans que l’utilisateur ait à décider. En clair, on délègue à l’outil le soin de ne pas surconsommer. C'est un retournement notable pour une entreprise qui, depuis deux ans, a intégré l’IA dans Windows, Office et Azure en poussant ses collaborateurs à l’utiliser sans limite.

Les ingénieurs de la division Experiences & Devices devront abandonner Claude Code d’Anthropic avant le 30 juin 2026, date de clôture de l’exercice fiscal. L’outil, déployé en décembre 2025 auprès de milliers de développeurs, chefs de projet et designers, avait séduit au point de supplanter GitHub Copilot CLI dans l’usage quotidien et les équipes en avaient consommé tant de tokens que la direction a mis fin à l’expérience.

Les ingénieurs de la division Experiences & Devices devront abandonner Claude Code d'Anthropic avant le 30 juin 2026 - ©Robert Way / Shutterstock

Sans plafond d’usage fixé en interne, des entreprises ont dépensé des centaines de millions d’euros en tokens d’IA en quelques semaines

Dans les grandes entreprises technologiques, des équipes ont instauré des classements internes où la productivité se mesure au volume de tokens traités par employé, comme chez Amazon. Ce type d’indicateur récompense la consommation, pas la qualité du travail produit.

Microsoft écrit aujourd’hui 30 % de son code à l’aide de l’IA générative, selon Satya Nadella lui-même. Ce chiffre élevé n’a pas empêché la dérive. Intégrer l'IA dans les flux de travail ne suffit pas à maîtriser les coûts si personne ne cadre quelle tâche mérite quel niveau de modèle.

Nous vous parlions récemment de cette entreprise non identifiée qui avait dépensé 460 millions d’euros en un seul mois sur Claude soit environ 500 millions de dollars, faute d’avoir défini des plafonds d’usage. Idem pour Uber qui avait épuisé l'intégralité de son budget annuel d’outils IA en quatre mois, selon un témoignage de son directeur technique.

Pour Satya Nadella, ses équipes doivent toujours se demander « Qu'est-ce que j'essaie de créer ? ». Non pas combien de tokens ont été consommés, ni quel modèle a été sollicité, mais quelle est la valeur du résultat.

Source : Windows Central

À découvrir

Quels sont les 5 meilleurs chatbots à intelligence artificielle ? Comparatif 2026

Comparatifs services

Par Mélina Loupia

Microsoft

Intelligence artificielle

Régulation numérique

Comparer

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !

Commentaires (0)

Poster mon commentaire

Commentaires (8)

Qesaco

Je suis ébahi que l’on découvre régulièrement l’eau chaude ou quelque chose que l’on voit arriver de loin …

L’Humain, par nature, aspire à ne rien faire, a de plus ne plus à horreur de l’effort, recherche la facilité, le « gain de temps » pour …s’adonner à des loisirs souvent devant un écran.

On l’a vu très vite avec les élèvent qui font faire leurs devoirs par des IA alors que ces travaux ont toujours été là pour qu’ils vérifient s’ils ont acquis des connaissances, un savoir faire pour développer leur intelligence, leur culture générale, une méthodologie etc …pas pour les « sanctionner » .

On a dans les classes, sur le marché du travail et en entreprises des individus qui n’ont jamais fait les efforts pour mettre la lumière à tous les étages et font appel systématiquement à « un ami » au moindre micro écueil …

gnagnagna

Ah, la ruée vers l’or n’enrichirait que les vendeurs de pelles. Surprise!

yorrha

Il faudra enquêter sur les fuites/mauvais usages de credentials, il doit y avoir un paquet de sites dans l’autre bout du monde qui vendent du SaaS avec ces accès en générant un site en quelques minutes, et les opérateurs font de rapides profits.

frigolu

Je ne suis pas du tout d’accord. Je suis aussi un homo sapiens, et je ne me reconnais pas du tout dans ce que tu décris. Je suis un boulimique de savoir, travailler est mon moteur vital, j’aurais largement le temps de glander à ma mort. Je suis donc l’antithèse de ce que tu décris, et j’ai pas mal de spécimens autour de moi qui te feraient mentir également.

Attention aussi à l’usage de « par nature » pour décrire les comportements globaux ou innés d’une espèce, qui ne le sont pas du tout. Cela supposerait que tu saches discerner ce qui est inné de ce qui est issu du conditionnement / milieu, ce qui n’est pas du tout le cas.

« L’homme n’est pas le seul animal qui pense, mais il est le seul qui pense qu’il n’est pas un animal ».

L’énergie que met notre espèce, depuis longtemps, à tout tenter pour se démarquer des autres animaux, est prodigieuse autant que vaine, car nos connaissances progressent également. Et plus nous en savons sur le reste du vivant, plus on se rend compte que nous n’avons rien de remarquable, contrairement à ce que nous nous évertuons à croire. Biologiquement, nous sommes des mammifères chétifs, omnivores (= opportunistes), pas très bien adaptés (mais nous sommes loin d’avoir le degré d’évolution d’autres espèces que nous côtoyons, qui sont au sommet de leur évolution depuis des dizaines de millions d’années). Longtemps, nous avons cru que notre atout était notre cerveau. Mais est-ce vraiment notre atout ou notre pire ennemi, notre pire tare (comme le pensaient Nietzsche ou Rousseau) ? Ce cerveau que nous admirons tant, devant lequel nous nous extasions, ne serait-il pas en réalité l’objet qui nous anéantira, et programmé pour cela (car comme toutes les espèces, nous disparaîtrons, et possiblement bien plus vite que les autres) ? Est-ce si avisé que ça que d’agir comme nous le faisons ?

Il faut, enfin, se méfier aussi de concepts désuets comme « l’intelligence », qui sont purement anthropocentriques (inventés par l’homme pour l’homme, pour tenter de se désigner comme « à part » encore et toujours) et scientifiquement douteux aujourd’hui, d’autant plus à une époque ou les frigos sont « intelligents » et ou on trouve même des « casseroles intelligentes ».

Qu’as-tu vu arriver de loin ? Je programme pour ce que le commerce appelle très abusivement « IA » (qui, comme tu le sais, a été théorisé dans les années 50), depuis 1979. J’ai donc vu tout cela naitre, évoluer, stagner en attente de l’invention du matériel adapté (ce qu’on nomme « les hivers de l’IA »), puis se relancer, puis évoluer à nouveau. Alors qu’as-tu vu arriver de loin au juste, et que Microsoft n’a pas vu arriver ? Tu as vu arriver le marketing, le « buzz » médiatique qu’a provoqué l’annonce d’OpenAI en 2023, en mettant un chatbot en accès gratuit avec une publicité mondiale titanesque ? Bien sûr, puisque tu savais que le modèle GPT-1 existait depuis 2018, que nous utilisions des chatbots avec d’autres modèles depuis au moins 2013, et que le modèle GPT est basé sur l’architecture Transformer développée par Gogol en 2017. Tu savais. Je te félicite.

Palou

C’est tellement facile de voir chez les autres ce que l’on ne voit pas chez soi …

Korgen

Et après on s’étonne que chaque maj de win 11 est buguée comme c’est pas permis…

Loposo

D ou l’intérêt des modèles local type gemma 4 ou qwen, xa repond a la majorité des choses et utiliser le reste que pour du travail qui demande grosse précision.
A l entreprise de mettre xa en place et pas donner un acces bêtement aux modèles les plus chers sans alternatives et explications

Blade_Hunter

Exactement… Ça me fait penser très fort aux fourmis avec leur société super structuré et qu’ils ont développé l’agriculture et l’élevage bien avant l’apparition des êtres humains