Baptisée « Federated analytics », cette méthode permet d'assurer la confidentialité des données analysées.
Lire l'article sur The Verge
Google’s federated analytics method could analyze end user data without invading privacy
En quelques mots :
- Federated Analytics : c'est le nom donné à la technique d'analyse de données que Google a détaillé dans un article de blog. Elle permet de traiter les données stockées localement, sur un appareil, et de rendre uniquement les résultats (et non les données brutes) accessibles à l’ingénieur en charge. Le dispositif permet ainsi de mieux assurer la confidentialité des données de l’utilisateur de l’appareil. Cette méthode s’inspire d’une branche de l’intelligence artificielle baptisée « federated learning », qui permet d’entraîner un algorithme sur les données de plusieurs appareils indépendamment, sans mêler ces groupes de données entre eux.
- Enrichir les applications. Google affirme avoir notamment utilisé cette technique pour repérer les mots communément utilisés par les utilisateurs de smartphones dans leurs échanges de messages électroniques, et ce afin d’enrichir le dictionnaire de mots répertoriés et l’efficacité du correcteur orthographique. Un algorithme d’intelligence artificielle a ainsi été entraîné à repérer, sur différents téléphones, les mots régulièrement employés qui ne figuraient pas déjà dans le dictionnaire de Google. Aucune des données concernant ces mots n’a quitté les téléphones des utilisateurs, mais le correcteur orthographique a pu être directement enrichi grâce aux analyses effectuées par l’algorithme. Cette technique pourrait à l’avenir être employée pour améliorer d’autres produits Google sans menacer la vie privée des utilisateurs.
- Rendre les sciences des données moins intrusives. Les méthodes d’analyse des masses de données exigent de déplacer d’importantes quantités d’informations pour les traiter et obtenir des résultats. Or, chaque fois que l’on déplace des données, on accroît le risque d’une fuite ou d’une faille de sécurité susceptible d’exposer des informations que les utilisateurs ne souhaitaient pas rendre publiques. En témoignent les innombrables scandales apparus au cours des dernières années, où des données utilisateurs se sont retrouvées exposées sur des serveurs non protégés. Ce genre de technique pourrait permettre de bénéficier du formidable potentiel de l’analyse de données tout en protégeant mieux la vie privée des internautes.