Le RGPD et le stream computing

En matière de protection des données, il y a eu un avant et après le 25 mai 2018. Malgré des intentions louables, le Règlement Général de Protection des Données (RGPD) est devenu la bête noire de beaucoup d’entreprises. Si l’on peut se réjouir qu’un cadre légal soit en place pour protéger nos données personnelles, on regrettera les complications administratives associées à l’ère du Big Data. Le stream computing ou l’analyse des données en continu est une piste intéressante pour éviter la collecte et le stockage inutile de données. Nous nous intéressons dans cet article au lien entre stream computing et RGPD.

gdpr-lock-1300px

Le RGPD, un défi permanent

Voilà environ deux ans que le RGPD est entré en vigueur. Si pour la plupart des citoyens, l’impact concret du Règlement se limite à cliquer sur le bouton « J’ai compris » ou « J’accepte » avant de visiter un site internet, il en va autrement pour les entreprises. Selon une étude de Capgemini, seules 28% des sociétés étaient en conformité avec le RGPD en juin 2019. Beaucoup d’entre elles indiquent d’ailleurs avoir certains doutes quant à son interprétation.

En outre, les coûts associés à la mise en conformité avec le RGPD sont importants. L’International Data Corporation (IDC) estime que les entreprises françaises dépenseront environ 4,3 milliards d’euros entre 2017 et 2021 pour ce poste.

Beaucoup d’entreprises - en particulier les PME et les TPE - ne disposent pas des ressources humaines nécessaires pour assurer le suivi et garantir la conformité de leur politique de traitement des données. Cette difficulté est d’ailleurs combinée avec le fait que la quantité de données collectées ne cesse de croître. Le RGPD, c’est donc le tonneau des Danaïdes des temps modernes.

Malgré ces complications, l’existence du RGPD est une excellente barrière de protection pour les citoyens européens à l’heure où le marché des données s’apparente à une criée au poisson. Le California Consumer Privacy Act, qui devrait entrer en vigueur dans le courant de l’année 2020, s’en est d’ailleurs directement inspiré.

Heureusement, en repensant quelque peu l’architecture de la collecte et du traitement de données dans l’entreprise, il est possible de se simplifier la vie en minimisant le champ d’application du RGPD. Les dirigeants comme les employés pourront ainsi consacrer leur temps à gagner des parts de marché plutôt qu’à rédiger des conditions d’utilisation.

plane-trail-turquoise-1300px

Le stream computing ou l’analyse des données en continu

Pour beaucoup d’organisations, l’enjeu n’est plus la collecte des données mais bien leur utilisation. Les flux de données incessants doivent être traités afin d’en tirer le meilleur parti. Le stream computing est une méthode de traitement des données en continu qui séduit et rencontre un succès croissant.

Plutôt que de conserver les données, les techniques de stream computing extraient l’information pertinente sans interruption. Le temps de latence est donc réduit au minimum et les données sont traitées de manière instantanée. Le stream computing est souvent utilisé dans le cadre de modèles prédictifs (par exemple les prévisions météorologiques).

Dans le cadre du RGPD, l’avantage majeur du stream computing réside dans le fait que les données sont utilisées mais ne sont pas conservées. Les entreprises ne doivent donc pas mettre en œuvre des systèmes complexes pour garantir la protection desdites données.

Le stream computing implique une intégration des différentes sources des données disponibles afin de les traiter de manière continue, en temps réel. Des outils analytiques sont bien évidemment indispensables pour extraire l’information pertinente. L’objectif ultime pour l’entreprise est bien entendu de déceler en premier des opportunités ou des menaces éventuelles. Une telle démarche prend dès lors tout son sens au sein de marchés hautement compétitifs comme la sphère financière par exemple mais il y a une infinité d’autres applications.

Prenons le temps de donner quelques exemples. Si votre Uber vient vous chercher à l’endroit où vous vous situez à un moment précis et non au coin de la rue précédente, c’est grâce au stream computing. On peut aller plus loin dans le secteur automobile en pensant aux voitures intelligentes et autonomes. Comment imaginer une voiture qui prendrait des décisions avec quelques secondes de retard ? Les données de route doivent impérativement être analysées en continu sous peine de se retrouver dans le décor. Le stream computing revêt également une utilité en matière de cybersécurité pour détecter en permanence les tentatives d’intrusion et autres menaces.

umbrellas-1300px

Avantages du stream computing dans le cadre du RGPD

On l’a dit plus haut, le stream computing permet de limiter le champ d’application de la RGPD. Il peut également être utilisé pour assurer la conformité avec le RGPD.

Nous vous résumons ici les principaux avantages de cette technique dans le cadre du RGPD :

  • Limite le stockage des données ;
  • Évite la duplication des données ;
  • Permet d’anonymiser les données pour les utiliser à un stade ultérieur ;
  • Permet de prévenir les menaces et cyberattaques ;
  • Peut être utilisé pour démontrer la conformité permanente avec le RGPD pour les flux de données sensibles.

Au-delà de ces avantages majeurs, le stream computing permet également de combler une série de besoins spécifiques à chaque organisation. Ces avantages doivent être évalués au cas par cas.

Pas d’exclusivité dans le traitement des données

Le stream computing a bien des atouts mais il ne convient pas à toutes les situations. Dans certains cas, il sera préférable d’analyser les données par bloc et donc de conserver l’information pour un certain temps du moins.

Prendre le temps de réfléchir aux différents flux de données et à l’utilisation que l’entreprise veut en faire est trop souvent considéré comme un luxe alors qu’il s’agit d’une véritable nécessité. Restons dans la sphère automobile pour illustrer cette nécessité. Obtenir des données sans avoir réfléchi à comment les traiter c’est un peu comme si un coureur de Formule 1 se lançait sur le circuit sans l’avoir reconnu au préalable ou sans tenir compte du contexte le jour J. Mettre des pneus pluie alors que la piste reste sèche fera perdre de précieuses secondes. Un virage difficile ne sera correctement négocié que si le pilote connaît le circuit dans ses moindres détails et a pris le temps d’en analyser les particularités.

Traiter ses données de manière adéquate pour en extraire l’information dont on a besoin, c’est exactement comme gagner une course de Formule 1. Cela implique une préparation minutieuse, de longue haleine et surtout une équipe qui vous donne les clés pour damer le pion à votre concurrent et espérer la douche de champagne.

Chez Ryax, nous mettons notre équipe et nos compétences à votre service pour tirer le meilleur parti de vos données et espérer donc ainsi remporter la course mais surtout l’ensemble du championnat. N’hésitez pas à nous contacter pour en discuter.

La Ryax Team.