Datalake : définition et ROI

Data

Le datalake a-t-il un ROI ? Avant d’essayer de donner une réponse, rappelons la définition d’un datalake. Si vous vous posez les questions « qu’est-ce qu’un datalake ? » et « le datalake a-t-il un ROI ? », alors cet article est fait pour vous.

Qu'est-ce qu'un datalake ?

Le datalake : nouvel outil de stockage des données permettant de faire passer l’entreprise dans le nouvel âge de la data, est souvent la réponse technologique à de nombreux espoirs.

Les promesses du Big Data, de réalisations de cas d’usages plus performants, vecteur de transformation de l’entreprise ont poussé de nombreuses entreprises à s’engager dans la dynamique de création des datalakes avec des ambitions importantes.

La communication autour de l’IA, l’automatisation des processus, le conseiller augmenté ou le marketing gonflé à l’IA a contribué à accélérer le déploiement des datalakes.

Dans un datalake, les données peuvent être structurées, non-structurées ou semi-structurées pour une utilisation ultérieure, au contraire d'un Data Warehouse qui possède essentiellement des données traitées et structurées

Le datalake a-t-un ROI (ou qui veut la peau des datalakes) ?

Ces nouvelles plateformes data représentent des investissements importants, car depuis les premières années et la vision Open Source, le marché s’est structuré. Les éditeurs de plateforme ont structuré des offres adaptées et permettant d’offrir l’ensemble des éléments de sécurité.

Après des investissements de plus de 100 millions d’euros et de plusieurs mois de travail pour les équipes IT, et de nombreux rebondissements (mise en conformité RGPD, sécurité..) vient le moment tant attendu de la phase d’alimentation des données.

Après cette longue phase d’attente, l’urgence de rendre opérationnel le datalake fait que les pratiques de gestion de la donnée sont bien souvent oubliées, ou reléguées à « on verra plus tard ».

À ce stade, nous avons donc un espace permettant de dupliquer toutes les données de l’entreprise, pour un coût création et de gestion qui ne cesse d’augmenter.

Au-delà du surcoût immédiat et de la difficulté de gestion que pose cette duplication rapide des données de l’entreprise (nécessité de garder les informations synchrones, identifier la bonne source de données…), souvent effectué sans déploiement de pratique de gouvernance de données, il se pose avant tout la question de la rentabilité de ces plateformes.

Ces solutions technologiques ont été créées pour assurer un service, et donc assurer la continuité d’un usage existant. Il devient donc urgent de libérer les nouveaux usages tant attendus et qui ont été réfléchis durant les semaines précédentes, et c’est à ce moment que de nouvelles difficultés surviennent.

Les usages alternent entre

  • des réalisations simples, afin de valider la plateforme et les compétences, mais apportant peu de valeur
  • des usages trop complexes ne tenant pas compte de la maturité de l’entreprise, de la maîtrise du patrimoine data.

Le datalake et la tranformation des entreprises

Différentes études montrent que 80% des usages ne passent pas l’étape de la mise en production. Les usages d’IA tant attendus semblent alors bien loin et le positionnement du datalake pose ainsi question.

Il faut donc revenir aux fondamentaux et prendre une nouvelle fois du recul sur la technologie. Le datalake n’est qu’un moyen qui permet d’accompagner la transformation de l’entreprise. Cette transformation doit donc être appuyée par une réflexion sur le business model à déployer pour accompagner la transformation de l’entreprise en lien avec le datalake et le modèle opérationnel associé.

La réussite de ce type de ces transformations nécessite un alignement complet

  • de l’organisation
  • des processus
  • des collaborateurs
  • de la data.

Cet alignement est le seul moyen de valoriser ces investissements et mettre en marche l’ensemble des fonctions de l’entreprise vers un but commun et qui offre une vision précise du ROI en permettant donc d’absorber les coûts de ces nouvelles infrastructures.

Pour aller plus loin sur la data

iqo cabinet conseil strategie data

Data For Good

L’ouverture et la réutilisation de la donnée au service du bien collectif Face à l’injonction permanente d’accélérer l’ouverture des données et leur réutilisation pour couvrir

Lire la suite »