Nombre de projets de data science restent bloqués au stade du PoC et ne parviennent pas à entrer dans la phase de mise en production. Les raisons en sont nombreuses : manque de compétences ou manque de données… Toujours est-il que les blocages sont persistants. Alors, quels moyens mettre en œuvre pour (enfin) dépasser le stade du PoC ?
Pourquoi tant de projets restent-ils bloqués au stade du PoC ?
Plusieurs raisons expliquent les blocages en phase de Proof Of Concept (PoC), ou « preuve de concept » en Français.
Déjà, les problèmes techniques trouvent toute leur place dans la stagnation du projet au stade du PoC. Les entreprises sont souvent confrontées à un manque de données exploitables. Résultat, un projet qui tombe à l’eau après la phase de PoC quand on se rend compte que les données ne sont pas suffisamment fiables. Plus encore, cela peut-être aussi un problème de définition d’une problématique de travail pas assez claire pour orienter le projet dans la bonne direction et obtenir des résultats utilisables.
De plus, les projets en data science sont confrontés à des problèmes liés à la concrétisation du projet en lui-même. Dès le départ, les équipes doivent travailler main dans la main pour éviter les projets trop abstraits et éloignés des réalités. Se projeter au plus près du rendu final attendu qu’utiliseront concrètement au quotidien les représentants métier est indispensable. De plus, les PoC peuvent ne pas aboutir car l’entreprise se rend compte qu’elle ne dispose pas des compétences nécessaires en interne ou que le projet va lui coûter trop cher.
Enfin, il existe aussi des freins tenant aux mentalités. Les entreprises n’ont pas encore pris toute la mesure de la richesse contenue dans leurs données. Aussi, si le projet d’analyse de données passe par la phase du PoC, il ne dépassera parfois jamais cette phase pour venir se frotter à la réalité car le retour sur investissement perçu est souvent flou… On rencontre alors un autre problème : le temps d’envisager une éventuelle industrialisation, les données peuvent se périmer… C’est d’autant plus vrai que la mise en production est souvent un processus de longue haleine !
Un chiffre résume à lui seul les difficultés du passage à l’industrialisation du PoC : aujourd’hui, on estime entre 20 à 30 % les projets qui passent à la phase d’industrialisation, les autres restant embryonnaires ou bloqués en PoC.
Un PoC : pourquoi faire ? L’indispensable cadrage du projet
La phase du PoC est la première des phases du cheminement d’un projet de data science. C’est en cela qu’elle est essentielle : il faut pouvoir jeter des bases solides et sûres pour monter un projet qui va aboutir. C’est là la raison d’être du Proof Of Concept : démontrer la faisabilité ou non d’un projet.
Néanmoins, il faut noter que la phase du PoC est parfois confondue ou mêlée avec la phase du prototype. On explique cela par le fait que le prototype a une visée plus pratique que le PoC. Par exemple, il peut être réutilisé plus facilement après et se rapproche donc un peu plus de l’industrialisation. À l’inverse, le PoC ne se prête pas à industrialisation, tout simplement parce que ce n’est pas son rôle ! Il vise seulement à étudier la viabilité d’un projet.
Pour autant, cela ne signifie pas qu’il faut se passer de PoC : en réalité, toutes les idées de projet en data science devraient se confronter à l’épreuve test du PoC.
Le PoC est aussi le moment où vous devez convaincre vos équipes et les fédérer autour d’un projet. Impliquer tous les acteurs concernés est toujours fondamental pour la réussite d’un projet.
Finalement, le PoC permet un cadrage de projet rigoureux. En clair, un bon PoC réunit 4 éléments :
· Un objectif précis illustré par un cas d’usage concret ;
· L’identification claire des contraintes (contraintes matérielles, budgétaires, techniques…) ;
· Une connaissance des risques (éthique, RGPD, etc.) ;
· La mise en place d’indicateurs de performance (KPI) ainsi que d’une date butoir pour en finir avec le PoC. Cela permet de faciliter le passage à la prise de décision et aux étapes suivantes du projet.
Passer par une phase de PoC est donc absolument indispensable. Seule exception : si vous avez déjà effectué des projets de data science et que vous êtes rodés à l’exercice. Dans tous les autres cas, c’est une étape plus que conseillée. Et elle est d’autant plus si vous êtes déjà resté bloqué dans le « datalab » avec un précédent projet… Bref, avec le PoC, le tout reste d’en sortir !
5 Conseils pour dépasser le stade du PoC
1. Ne perdez pas de vue la valeur métier
Dès la phase du PoC, il ne faut pas oublier d’avoir une idée précise et concrète des cas d’usage possibles du projet. Mais surtout, il ne faut pas la perdre de vue en cours de route !
De plus, les cas d’usage doivent être clairs pour tout le monde mais surtout pour les premiers concernés : les représentants métier. À défaut, ces derniers risquent de se détacher du projet.
2. Anticipez la mise en production (et ses aléas)
La mise en production peut être souvent le moment d’un dur retour à la réalité…
En conséquence, il faut se projeter dans la phase d’industrialisation en ayant un œil avisé et réaliste sur toutes les contraintes du processus de mise en production. Il faut anticiper l’évolution dans le temps des données, les coûts de mise à jour, l’éventuelle complexification des données… Tout en étant conscient qu’entre la mise en production et le PoC, il y a forcément un « gap ».
Ces efforts permettent de repérer assez tôt dans le cheminement du projet les problèmes potentiels et d’y remédier avant qu’il ne soit trop tard.
3. Prenez votre temps et suivez les étapes dans l’ordre
Franchir les différentes étapes d’un projet de data science pas à pas est indispensable pour ne pas avancer trop vite et risquer de rester bloqué.
À chaque étape, il faut prendre le temps de faire le bilan des avancées et des objectifs à atteindre pour l’étape suivante. En d’autres termes, il faut se poser la question à chaque phase si l’on est prêt à passer à la suivante (« go ») ou s’il faut attendre encore un peu (« no go ») pour pouvoir avancer sur des bases solides.
Par exemple, au stade du pilote, évaluer la performance du modèle mais aussi la satisfaction des professionnels métier est important pour voir si on passe à la production.
4. Soyez agile
Tout projet innovant implique des allers-retours, des essais et des erreurs. Bref, vous serez forcément confrontés à des chemins de traverse et vous devrez peut-être changer de route. Le tout est de savoir se remettre en question et de questionner et revoir ses objectifs s’ils ne correspondent plus à la réalité.
Dans la grande majorité des cas, mener un projet en data science est forcément nouveau pour l’entreprise qui doit se donner le droit à l’erreur et se laisser de la marge pour l’expérimentation. Sinon, gare à l’impasse !
5. Commencez petit
Un bon projet de data science devrait commencer petit. Inutile de se lancer dans d’ambitieuses réalisations dès le premier essai.
Point de départ de tout projet de data science, le PoC est indispensable et doit être mené avec rigueur. Mais il faut aussi savoir en sortir… Dépasser le stade du PoC nécessite alors une gestion de projet efficace.
La Ryax Team.