Derrière l'émulation, une inquiétude circulait au Big Data Congress 2016 : alors que le secteur est en train d'exploser, il n'y a pas assez de data scientists. La formation supérieure ne l'a pas prévu suffisamment tôt, et l'appétit des entreprises en matière d'analyse de données croît. Il est en train de bouleverser les équipes de direction des plus grandes marques comme des PME. Et si certains n'hésitent pas à recruter directement en Chine ou en Inde, d'autres y sont encore réticents et attendent que certaines fonctions du data scientist soient récupérées par des formations courtes de type licence.
« La demande n'a tout simplement pas encore rencontré l'offre » résume Jeremy Harroch, fondateur de Quantmetry, qui confirme les chiffres : 4,4 millions d'emplois de data scientists dans le monde en 2015, dont seulement 40 % seraient pourvus, selon Gartner qui prédit également que ce chiffre soit multiplié par cinq d'ici à 2017. Des chiffres qui pourraient vite s'emballer dans les années à venir, au regard du nombre encore minoritaire des entreprises ayant fait le grand saut du big data (seulement 20% des entreprises utilisent l'analyse de données en masse aux Etats-Unis).
« Il faudrait que le métier soit moins élitiste, et que comme au Canada ou aux Etats-Unis, des formations courtes voient le jour pour toute la partie data mining » dira Jean-Paul Isson, dont l'un des métiers est d'encadrer une certification data en un an à Montréal. L'expert en analyse prédictive n'a aucun complexe à avouer que chez Monster, « on est justement en train de faciliter les procédures juridiques pour embaucher plus facilement des jeunes diplômés indiens et chinois ».
Champ des compétences du data scientist (Wide/Micropole)
Car être data scientist signifie aujourd'hui, capter, structurer, analyser, modéliser des données en masse, sans compter la partie développement de programmes ou la maîtrise de langages informatiques comme Python et SQL. Toutes ces compétences pourraient ainsi être séparées en sous-groupes, et déléguées à divers profils : statisticien, ou data miner, plus à l'aise pour analyser et modéliser des données mais moins mathématiciens que le data scientist qui adapte régulièrement des algorithmes (quand il n'en crée pas) qui sont parfois auto-apprenants (machine learning).
D'autant plus que le data scientist y trouverait peut-être mieux son compte. Libéré de certains pans de son activité, il serait plus à même de donner libre cours à son imagination, et le sens de l'innovation est une qualité très prisée chez les data scientists. Pour Chrystel Galissié, directrice associée chez Wide (Micropole), « le datascientist a une créativité que le data miner n'a pas forcément pour capter des informations sur les réseaux sociaux ou pour les réutiliser », « le data miner a plutôt appris à réutiliser des modèles ».
« Ces profils ont une habitude de contourner très forte » nous confie-t-elle encore, « ils sont très excités à l'idée de cracker certains programmes de contrôles pour récupérer des données, et parfois quelques camarades se font attraper par la patrouille. »
Golden boy du nouvel or noir
Chrystel Galissié pense même que c'est sûrement ce qui fera la différence, la créativité, le jour où les postes à pourvoir seront moins nombreux. C'est déjà ce qu'elle traque chez les candidats : « la curiosité, un goût éventuel pour l'aventure, quelque chose qui le démarque du cliché "derrière son PC avec des lunettes" ». « Certains sont très bons techniquement, mais ont du mal à s'intégrer à la vie opérationnelle » ajoute-t-elle, « et puis il y a un conditionnement des écoles parfois, quelque chose d'un peu élitiste, qui ne joue pas en leur faveur. »Mais pour le moment la « geek féministe » (ainsi qu'elle se décrit elle-même) pallie le cruel défaut de nouveaux arrivants en misant sur la formation interne : « on recrute quelques data scientists, et des data miner qu'on fait monter en compétence. », « il nous faut environ douze data scientists par an, mais on sait qu'on ne les trouvera pas », « aujourd'hui une promo annuelle, c'est 25 diplômés au mieux sur tout le territoire ».
Chief Data Officer : le troisième type
Dans la bouche des patrons comme des RH, un problème subsiste dans le profil « super matheux, super geek » : l'adaptabilité aux besoins spécifiques d'une profession ou d'un secteur, que certains appellent « la brique métier ». Il semble que ce soit un aspect plus ou moins délaissé par les écoles, formant des diplômés qui comprennent mal les enjeux, ou ne savent pas prédire les conséquences professionnelles d'une analyse de données. Souvent cité, l'exemple de la capacité à anticiper les résiliations de contrat en milieu bancaire, en vue de faire des propositions et de les désamorcer.C'est ce défaut d'analyse métier qui pousse actuellement les écoles de commerce à s'engouffrer dans la formation data. Il ne s'agit pas de concurrencer les data scientists sur le terrain des maths, mais bien plutôt de créer ces nouveaux profils qui feront le pont entre la technique et la fameuse partie « métier ». En somme : des managers, conscients des enjeux business mais aussi avisés des possibilités du big data.
Ce poste, parfois appelé « chief data officer », existe déjà dans les compagnies qui ont un département data dédié, et ne se sont pas contenté d'embaucher un scientist à qui l'on en demande trop. Nombreux étaient en effet, dans les premiers temps de l'engouement big data, les « super juniors » livrés à eux-mêmes (et stagnant sur leurs acquis d'école), de qui on attendait des sortilèges aux effets immédiats. Aujourd'hui les groupes comprennent qu'il faut répartir la nouvelle science de la donnée, même si pour Jean-Paul Isson, « il faudra que les futurs chief data officer ne soient pas non plus que de simples business manager comme souvent aujourd'hui, mais qu'ils aient une véritable compétence technique, un profil hybride. »
A lire également