Aller au contenu

Big data : structurer les données, une gageure pour les entreprises ?

Pour tirer parti du big data, les entreprises doivent commencer par structurer leurs données.

Epiq Systems, London portraits 5th September 2012Une tribune de Martin Bonney, directeur international des services de conseil d’Epiq Systems.

Si les entreprises du secteur tertiaire veulent relever les défis posés par le big data, il est essentiel qu’elles adoptent une approche proactive et pérenne en matière de gestion de l’information. En effet, le big data constitue un défi de taille pour les entreprises qui se trouvent aujourd’hui au cœur d’une véritable explosion du volume des données.

À titre d’exemple, une grande firme américaine figurant au classement des 500 premières entreprises répertoriées par le magazine Fortune produit chaque année plusieurs pétaoctets de données électroniques. Chaque employé est susceptible d’envoyer et de recevoir une centaine d’e-mails par jour, et toutes ces données transitent par les bureaux de centaines de personnes. Qu’elles soient stockées sur des disques durs, dans des bases de données, sur des bandes de sauvegarde ou sur des supports mobiles comme des clés USB ou des CD, ces données sont archivées et répliquées, augmentant ainsi de façon exponentielle.

Toujours plus de données à stocker

Une étude menée en 2012 a révélé que 2,8 zettaoctets d’informations ont été créés cette année-là. On prévoit même jusqu’à 40 zettaoctets pour 2020, une quantité 50 fois plus importante que celle observée en 2010. La collecte, le stockage et l’extraction des données constituent un défi en constante évolution, rendu plus difficile encore par la grande diversité des supports mobiles et connectés à même de générer lesdites données.

Afin de respecter des réglementations toujours plus contraignantes et pour répondre aux demandes des autorités nationales, il est essentiel de savoir précisément où sont stockées les données et de pouvoir y accéder facilement. Nous avons récemment mené une enquête* sur les conséquences induites par l’accroissement du volume des données pour les grandes entreprises. Plus des trois quarts des firmes consultées ont déclaré être confiantes en leur capacité à accéder aux éléments nécessaires en cas d’enquête ou de litige. Cependant, des recherches plus approfondies laissent à penser qu’une telle confiance n’est pas justifiée.

L’enquête révèle en effet que seule la moitié des entreprises interrogées contrôlent et mettent à jour régulièrement leurs bases de données. Les délais réglementaires pour produire des documents étant parfois inférieurs à 14 jours, si les données ne font pas l’objet d’un examen constant, il est plus compliqué de répondre à une demande avec rapidité et précision, et de manière défendable.

Ordonner ses bases de données, clef du succès

Par où commencer et comment se repérer dans ce labyrinthe de données ? Adopter une approche proactive suppose tout d’abord d’avoir une compréhension claire de l’univers des données, des règles de conservation des archives et des exigences légales et réglementaires qui en découlent pour les entreprises. Les bénéfices de cette approche sont évidents, non seulement en termes de réduction des coûts de stockage (que nombre d’entreprises estiment à 40 %), mais aussi en termes de coûts liés au traitement et à l’examen des documents.

Pour une stratégie de gestion de l’information efficace, la planification et la communication sont essentielles. Malgré les différences entre secteurs d’activité, la gestion de l’information peut être appréhendée et évaluée suivant une méthodologie définie que nous présentons comme suit :

  • Inventorier les bases de données qui contiennent des informations importantes et indiquer la nature de l’information stockée dans chaque base de données ;
  • Comprendre les interactions entre les différents systèmes ;
  • Réduire le nombre de bases de données ;
  • Identifier les données importantes et établir un processus de sélection durant les réunions et les sessions de consultation ;
  • Trouver un accord sur les éléments à conserver lors de la production de la base de données, sur les formats, la documentation et le planning ;
  • Développer des méthodologies d’extraction, des scripts, ainsi que des processus de vérification de la qualité des données extraites.

Le paysage des données changeant constamment, sa gestion ne peut se résumer à un exercice ponctuel. Un contrôle irrégulier des données est insuffisant, et toutes les grandes entreprises reconnaissent aujourd’hui les avantages de s’associer à des experts qui peuvent les aider à adopter une approche proactive et pérenne en matière de gestion de l’information.

Martin Bonney, directeur international des services de conseil d’Epiq Systems

*Méthodologie
Enquête réalisée par téléphone en novembre 2013. 100 personnes appartenant à de grandes entreprises (définies comme réalisant un CA annuel supérieur à 500 millions de dollars, mais 74 % de celles ayant participé à l’enquête affichant un CA annuel supérieur à 1 milliard de dollars) ont été interrogées au Royaume-Uni, en Allemagne, aux Pays-Bas et en Suisse. De grandes entreprises européennes ont participé, représentant les secteurs suivants : industrie et BTP, commerce de détail, services financiers, distribution d’énergie ou d’autres services essentiels, industrie pharmaceutique, services professionnels et informatique/télécommunications. Au sein de chaque société, la personne interrogée occupait le poste de directeur financier, de responsable de la conformité ou de directeur du département juridique.

Photo : Flat design vector illustration concept of big data par Shutterstock/Bloomua

Publié dansEconomieEntreprisesIndustrie