L’expression « big data » signifie littéralement « grosses données » ; en français, l’on parle aussi de « mégadonnées » ou de « données massives ». Le concept de big data doit son émergence à l’explosion des données en parallèle de l’évolution des outils de stockage.
Cela amène un défi de taille, à savoir le traitement, l’analyse et l’exploitation de ces données, lesquelles sont hétérogènes par définition. Dans le domaine du marketing, le big data permet d’améliorer la performance d’une marque tout en réduisant les risques et ce, grâce au ciblage des consommateurs et à l’analyse des marchés.
Historique
Le terme de « big data » apparaît pour la première fois dans des articles scientifiques parus en 1997. A cette époque, les chercheurs posent le problème de la croissance exponentielle des données numériques et du défi que représentent leur visualisation et leur traitement.
La notion de « grands ensembles de données » se popularise nettement au début des années 2010. Les réseaux sociaux, les objets connectés, la géolocalisation, le marketing mobile… génèrent toujours plus d’informations et ce, de façon exponentielle. Dès lors, les enjeux que représentent le big data sont en effet de plus en plus importants, d’un point de vue commercial certes, mais aussi sur les plans politique, économique et social.
Dimensions
Le big data se comprend au vu de trois principales dimensions, baptisées les « 3 V » :
- Le Volume: les données stockées sont en constante expansion et ne peuvent être traitées par des solutions classiques
- La Variété: les données sont complexes dans la mesure où elles proviennent de nombreuses sources et sont de nature variée
- La Vélocité: la collecte, l’analyse et l’exploitation des données sont des actions qui doivent se réaliser le plus possible en temps réel ou quasi-réel
A ces trois critères fondamentaux peuvent s’ajouter deux autres « V » :
- La Véracité: les données présentent un niveau de fiabilité variable qu’il s’agit de ne pas négliger
- La Valeur: toutes les données collectées n’ont pas le même potentiel d’exploitation, ce qu’il faut savoir reconnaître pour que la stratégie de big data soit rentable
Applications
Collecter et stocker les données est une chose ; les structurer pour les analyser en vue de les exploiter en sont d’autres. Une stratégie big data nécessite donc de multiples compétences pour être efficace, en plus de solutions techniques performantes.
Elle s’applique dans de multiples secteurs d’activité : bancaire (détection de fraude), météorologique, ressources humaines (prévention de l’absentéisme), santé, recherche, transports, énergie, éducation, loisirs…
L’analyse des données permettra dans l’absolu de comprendre le profil des utilisateurs, leur parcours, leurs comportements et habitudes. Il sera alors possible d’avancer des pistes d’amélioration des services et produits qui leur sont proposés via des campagnes publicitaires adaptées et tout en anticipant leurs besoins.
Risques
La quantité de données peut aussi devenir un obstacle. La mise en place d’un projet big data demande de la réflexion en amont afin de définir quelles données traiter et dans quel but. Il est indispensable que l’initiateur d’une telle stratégie se donne les moyens, tant en termes de solution technique que de ressources humaines et temps. Les données « sensibles » amènent aussi les entreprises à sous-traiter le moins possible leur exploitation.
Les risques d’atteinte à la vie privée et aux droits fondamentaux, les dérives constatées à l’échelle mondiale… sont aussi régulièrement mis en avant. Le tout dans un contexte « d’infobésité », une situation qui fait partie des grands enjeux de demain.