A l’heure du Big Data, les technologies de stockage des données numériques pour les entreprises se multiplient : Data Warehouse, Data Lake, DMP… comment s’y retrouver ?
Voici quelques clés pour essayer d’y voir plus clair parmi ces différents outils :
Ouverte à tous les collaborateurs de l’entreprise, la Data Warehouse est un entrepôt de données structurées dans une configuration précise, et mises à disposition des différents services d’une entreprise – logistique, commerce, marketing – avec une interface appropriée. Au sein d’une Data Warehouse, on trouve uniquement des données traitées, structurées et filtrées qui ont déjà été transformées dans un but spécifique et qui peuvent être utilisées par tous les membres de l’entreprise.
Moins cher mais moins structuré que la Data Warehouse, le Data Lake ou lac de données est une méthode de stockage de très larges quantités de données brutes, sans hiérarchie. De plus en plus utilisé par les entreprises, le Data Lake est alimenté en continu par un ensemble de canaux digitaux dont les données hétérogènes peuvent être mélangées. L’entreprise peut stocker l’ensemble de ses données (brutes comme transformées) au sein d’un seul Data Lake, et les avoir ainsi à portée de main pour puiser dedans selon ses besoins. Cependant, le Data Lake a plusieurs limites :
– Il ne permet pas d’établir de hiérarchie ou de catégorie entre les données, ce qui réduit la valeur qu’on peut en extraire ;
– En termes de sécurité des données, le Data Lake est moins avancé que la Data Warehouse ;
– Il faut des ingénieurs qualifiés comme les Data Scientists pour gérer les données stockées dans un Data Lake.
Prisée par les services de Marketing et les annonceurs, la DMP – Data Management Platform – est un logiciel permettant de trier et de stocker des informations issues de services online sur le site web d’une entreprise, pour les ressortir sous une forme exploitable pour les utilisateurs, en général les services de marketing. Cette plateforme sert à stocker, trier, analyser toutes les données des clients (informations de navigation, interaction avec les publicités, données issues des applications mobiles ou des réseaux sociaux, croisées avec celles du fichier client), et les regrouper en profils pour développer des campagnes marketing ou publicitaires ciblées avec précision.
On parle de plus en plus des CDP (Customer Data Platform), des logiciels permettant de centraliser les données clients dans une plateforme unique. On pourrait dire qu’il s’agit de DMP exclusivement consacrées aux clients. Le concept de CDP est incontestablement en vogue, mais il est difficile de savoir si le terme va durablement s’imposer comme étant le nouvel outil central de gestion de la relation client.
Face au développement de ces divers outils digitaux, mieux vaut bien cerner ses besoins avant de faire son choix : ce qui convient à une entreprise ne convient pas forcément à une autre…