Cela semble paradoxal. Le géant Google, dont les systèmes (notamment publicitaires) collectent les données des utilisateurs, a annoncé des outils open-source pour la mise en place d'une confidentialité différentielle.
Cela doit aider à protéger les données sensibles des utilisateurs sans remettre en question la pertinence des résultats fournis. Google souligne que cette confidentialité différentielle pourrait être utile dans d'autres secteurs, comme la santé ou la sociologie.
L'art de faire du bruit
C'est peut-être le contexte de tension du public vis-à-vis des atteintes à la vie privée qui a mené Google à rendre open-source les outils qu'elle utilise en interne. La firme américaine utilise la confidentialité différentielle pour obtenir des informations depuis des bases de données concernant ses utilisateurs, mais sans obtenir de données sur eux personnellement.La confidentialité différentielle est un procédé proche de la cryptographie, utilisé en big data. Apple la résume ainsi sur son site : « Nous utilisons le procédé inédit de la confidentialité différentielle, grâce auquel vos données sont mélangées à des millions d'autres. Ainsi, nous visualisons uniquement des schémas très généraux, et non des informations permettant de remonter jusqu'à vous ».
Si l'on veut entrer un peu plus dans les détails, il s'agit d'ajouter aléatoirement du « bruit », c'est-à-dire des données fausses au milieu de données correctes. L'ensemble, envoyé à la personne qui demande ces données, obtient une information qui est fiable, mais qui ne lui permet pas de distinguer le vrai du faux. Le procédé lui permet donc d'obtenir des informations sur son public, mais l'empêche d'obtenir des données sensibles sur un utilisateur en particulier.
Des usages pour tous
D'après Wired, ce que Google a rendu accessible aux entreprises « inclut ainsi des équations et des modèles permettant de fixer les limites et les contraintes d'identification des données, mais aussi une interface pour faciliter la tâche des développeurs dans l'implémentation des protections ».Pour Bryant Gipson, Manager en ingénierie chez Google, « cela concerne la protection des données et la limitation des conséquences de la diffusion des données. De cette façon, les entreprises peuvent toujours avoir des renseignements sur des données qui seront utiles à tous, sans faire quoique ce soit de blessant pour les utilisateurs ».
Miguel Guevara, Manager produit au bureau de la protection des données du groupe, insiste sur le blog de Google sur l'utilité de ces outils : « Ce type d'analyses peut être implémenté de bien des façons, et avec différents objectifs. Par exemple, si vous êtes chercheur dans le domaine de la santé, vous pourriez vouloir comparer le temps d'admission moyen des patients dans différents hôpitaux, pour déterminer les différences de soins. La confidentialité différentielle est une garantie, un moyen de s'assurer que les usages comme celui-ci se feront dans le respect de la vie privée ».
Google transmettrait les données personnelles des utilisateurs aux annonceurs, sans leur accord
À terme, Miguel Guevara annonce que cette confidentialité pourrait apporter de nouvelles fonctionnalités dans des services comme Google Maps ou Google Fi.
Source : Wired