©  PublicDomainPictures / Pixabay
© PublicDomainPictures / Pixabay

EvoDiff, voici le nouvel environnement logiciel de travail développé par Microsoft. Fonctionnant grâce à la puissance de l'IA, il sera utilisé notamment pour améliorer le processus de protein design.

C'est un domaine que le grand public connaît peu, mais que l'IA et le machine learning font avancer à grands pas : le protein design. Les protéines sont la source fondamentale de toute forme de vie, à l'échelle cellulaire. Une meilleure compréhension de leur fonctionnement permet, entre autres, de mieux comprendre les mécanismes des maladies.

Pour cela, on conçoit des protéines en laboratoire pour les étudier. Un processus très complexe et coûteux. C'est ici que l'IA intervient, et la solution de Microsoft, EvoDiff, promet d'apporter son lot de changements.

Un tournant dans la conception protéique

On le sait depuis quelque temps maintenant, l'IA générative est en train de bouleverser l'économie mondiale, avec de nouvelles méthodes de travail dans divers domaines. Plusieurs solutions logicielles ont déjà été développées pour améliorer la conception de protéines en laboratoire : AlphaFold de Google, FoldX ou Rosetta, pour les plus connues. Là où EvoDiff innove, c'est qu'elle peut générer des protéines à partir simplement d'une séquence donnée, ce qui simplifie grandement le processus. Traditionnellement, il fallait des informations précises sur la structure tridimensionnelle cible de la protéine souhaitée afin de prédire correctement la manière avec laquelle la séquence d'acides aminés se replierait pour être fonctionnelle.

En éliminant cette étape, le gain de temps et d'argent est énorme. Le chercheur principal de Microsoft, Kevin Yang, imagine déjà les applications potentielles d'EvoDiff dans différents domaines : création de nouvelles enzymes, usages industriels ou thérapeutiques…

© Lukassek / Shutterstock
© Lukassek / Shutterstock

Au cœur d'EvoDiff : une puissance computationnelle sidérante

EvoDiff doit principalement son efficacité au très grand nombre de paramètres dans lesquels il est capable de piocher : 640 millions. Tous sont formés grâce à des bases de données issues de différentes classes fonctionnelles ou types de protéines existantes. Le système fonctionne grâce à un modèle de diffusion (comparable à celui d'une IA génératrice d'images comme Stable Diffusion ou son concurrent Midjourney). Grâce à cela, il déduit et crée efficacement des séquences de protéines en éliminant le « bruit », c'est-à-dire toute information inutile ou non pertinente qui viendrait perturber le processus de conception.

Le système développé par Microsoft semble très prometteur, mais son efficacité n'a pas encore été clairement évaluée par des acteurs scientifiques extérieurs. Si celle-ci est un jour prouvée, EvoDiff marquera alors un grand pas dans les progrès de la bio-informatique.

Source : TechCrunch