Apple vient de dévoiler ses derniers travaux en matière d'intelligence artificielle avec ce nouveau modèle de langage, qui permet de modifier des images existantes en décrivant les changements par de simples bouts de phrase.
Apple est à la traine sur le sujet de l'intelligence artificielle. Alors que Microsoft n'en finit plus d'intégrer ChatGPT et les technologies d'OpenAI à l'ensemble de ses logiciels, et que Google multiplie les annonces autour de son dernier modèle de langage Gemini, le constructeur californien semble regarder le train passer et n'a fait jusqu'alors aucune annonce fracassante. Pourtant, les équipes d'Apple seraient sur le pied de guerre pour proposer leurs propres outils et services assistés par intelligence artificielle. La preuve encore aujourd'hui avec ce nouveau projet issu des laboratoires de Cupertino.
Un éditeur d'images qui se pilote à l'écrit
MGIE (pour MLLM-Guided Image Editing) est un modèle de langage spécialisé dans le traitement de l'image, et plus précisément des modifications d'image. L'idée derrière ce projet est de pouvoir appliquer des changements à une image fixe sans en passer par un logiciel de retouche, mais tout simplement en expliquant les modifications à l'écrit.
Ainsi, il serait possible de taper « Augmentes la luminosité de l'image » ou « Remplaces la couleur du ciel en rouge » pour que le logiciel comprenne l'indication donnée, et n'opère les modifications directement, sans aucune intervention humaine.
MGIE peut appliquer des modifications générales sur une image, ou entrer plus dans le détail avec une compréhension des éléments qui la composent. Dans l'exemple donné par Apple sur GitHub, où a été posté le projet, on peut par exemple voir que le modèle comprend ce qu'est un sapin de Noël, le repère sur l'image et le supprime après demande dans la boite de dialogue.
Apple semble vouloir accélérer sur l'IA en 2024
Le modèle MGIE va plus loin dans les ajouts proposés et peut enrichir des images avec quelques éléments de contexte. Dans un autre exemple illustré par les équipes d'Apple, on peut voir la photo d'une pizza tout ce qu'il y a de plus traditionnelle. En demandant à l'outil de rendre la pizza plus saine, l'intelligence artificielle viendra ajouter des légumes à cette pizza.
MGIE peut enfin opérer des modifications plus simples, comme un redimensionnement, un agrandissement ou un zoom dans l'image, ainsi qu'une rotation.
Si vous êtes intéressés à tester cette nouvelle technologie, Apple propose une version de démonstration sur le web et disponible à cette adresse. Il est possible à l'avenir que quelques-uns de ses outils fassent leur apparition dans les systèmes d'exploitation de la marque, comme macOS ou iOS, via l'application Photos.
On sait aussi que 2024 devrait être l'année de l'intelligence artificielle pour Apple, avec un iOS 18 annoncé comme une mise à jour historique. Siri ou encore l'application Messages pourrait recevoir des améliorations liées à l'IA et permettraient à Apple de rattraper en partie son retard sur ses concurrents.
Source : Engadget