Après avoir mis à jour le Bing Image Creator en décembre, Microsoft décide de faire marche arrière face aux nombreuses critiques des utilisateurs. Une déconvenue qui prouve qu'il est parfois difficile de mesurer les performances des modèles d'intelligence artificielle (IA) lorsqu'ils sont déployés à grande échelle.

Les logos de Microsoft Bing et d'OpenAI. © CryptoFX / Shutterstoc
Les logos de Microsoft Bing et d'OpenAI. © CryptoFX / Shutterstoc

Directement intégré au moteur de recherche Bing, Image Creator permet de générer des images à partir de simples mots-clés. Il s'appuie sur l'IA DALL-E d'OpenAI pour y parvenir, reflétant les liens forts qui unissent les deux entreprises : Microsoft a investi un total de 13 milliards de dollars dans la start-up qui a créé ChatGPT.

Récemment, le géant de Redmond a annoncé une mise à jour de sa plateforme pour qu'il supporte la dernière version de DALL-E, PR16. Il promettait de créer des images « deux fois plus rapidement qu'auparavant », avec une « meilleure qualité ».

Retour en arrière

Loupé. Dans la foulée, une pluie de messages critiquant le nouveau Bing Image Creator est apparue sur X.com et Reddit. Les témoignages ont fait état d'images moins réalistes qu'avec l'itération précédente de l'IA. Elles manquaient, par exemple, de détails et de finition.

La situation est telle que Jordi Ribas, dirigeant de la recherche chez Microsoft, a réagi sur X.com. Il a expliqué que le générateur allait finalement s'appuyer sur PR 13, l'ancienne version de DALL-E. « Tous les utilisateurs pro et environ 25 % des demandes utilisant des boosts sont maintenant sur PR13. Le processus de déploiement est malheureusement très lent. Il a commencé il y a plus d'une semaine et il faudra encore 2 à 3 semaines pour atteindre les 100 % », a-t-il précisé.

Des images générées par Bing Image Generator. © Capture d'écran Clubic
Des images générées par Bing Image Generator. © Capture d'écran Clubic

Pas une première

Pourtant, l'analyse comparative de Microsoft a révélé que la qualité de PR16 était « un peu meilleure en moyenne » que celle du modèle précédent. Une donnée qui illustre les difficultés d'évaluer les modèles avant leur déploiement.

Ce n'est pas la première fois qu'un géant de la technologie rencontre un problème avec son générateur d'images. Il y a quelques mois, Google a suscité un tollé après que Gemini ait créé des visuels historiquement faux, poussant l'entreprise à mettre la solution hors ligne le temps de la corriger.

Sources : The Verge, Neowin