Suivez nous sur
Classe de maître IA :

AI 101

Qu'est-ce qu'une Data Fabric ?

Le kit de préparation mis à jour on

Souvent associée à l’intelligence artificielle (IA) et au machine learning (ML), une structure de données est l’un des principaux outils permettant de convertir des données brutes en business intelligence.

Mais qu'est-ce qu'une Data Fabric exactement ?

Une structure de données est une architecture et un logiciel qui offrent une collection unifiée d'actifs de données, de bases de données et d'architectures de base de données au sein d'une entreprise. Il facilite l'intégration de bout en bout de divers pipelines de données et environnements cloud grâce à l'utilisation de systèmes intelligents et automatisés.

Les structures de données sont devenues plus importantes à mesure que des développements majeurs continuent d'avoir lieu avec le cloud hybride, l'Internet des objets (IoT), l'IA et l'informatique de pointe. Cela a provoqué une augmentation massive du Big Data, ce qui signifie que les organisations ont encore plus à gérer.

Pour faire face à ces mégadonnées, les entreprises doivent se concentrer sur l'unification et la gouvernance des environnements de données, ce qui a posé plusieurs défis tels que les silos de données, les risques de sécurité et les goulots d'étranglement dans la prise de décision. Ces défis ont conduit les équipes de gestion des données à adopter des solutions de Data Fabric, qui aident à unifier les systèmes de données, à renforcer la confidentialité et la sécurité, à améliorer la gouvernance et à offrir une plus grande accessibilité aux données pour les travailleurs.

L'intégration des données conduit à une prise de décision plus axée sur les données, et bien que les entreprises aient historiquement utilisé différentes plates-formes de données pour des aspects spécifiques de l'entreprise, les structures de données permettent de visualiser les données de manière plus cohérente. Tout cela conduit à une meilleure compréhension du cycle de vie du client et aide à établir des connexions entre les données.

A quoi sert une Data Fabric ?

Les structures de données sont utilisées pour établir une vue unifiée des données associées, ce qui facilite l'accès aux informations indépendamment de leur emplacement, de leur association à la base de données ou de leur structure. Les structures de données simplifient également l'analyse grâce à l'IA et à l'apprentissage automatique.

Un autre objectif d'une structure de données est de faciliter le développement d'applications, car il crée un modèle commun pour accéder aux informations, distinct des silos traditionnels d'applications et de bases de données. Ces modèles offrent un meilleur accès aux informations, mais ils améliorent également l'efficacité en établissant une couche unique où l'accès aux données peut être géré sur toutes les ressources.

Bien qu'il n'y ait pas une seule architecture de données pour une structure de données, on dit souvent que ce type de structure de données comporte six composants fondamentaux :

Avantages d'une Data Fabric

Les data fabrics présentent de nombreux avantages commerciaux et techniques, tels que :

Meilleures pratiques pour la mise en œuvre de Data Fabrics

Le marché mondial des données est en constante expansion et la demande dans ce domaine est forte. De nombreuses entreprises cherchent à mettre en œuvre une architecture de données pour optimiser leurs données d'entreprise et suivent certaines bonnes pratiques courantes.

L'une de ces pratiques consiste à adopter un modèle de processus DataOps. Data Fabric et DataOps ne sont pas identiques, mais selon un modèle DataOps, il existe une connectivité étroite entre les processus de données, les outils et les utilisateurs. En alignant les utilisateurs pour qu'ils s'appuient sur les données, ils peuvent tirer parti des outils et appliquer des informations. Sans modèle DataOps, les utilisateurs peuvent avoir du mal à extraire suffisamment de la structure de données.

Une autre bonne pratique consiste à éviter de transformer la structure de données en un autre lac de données, ce qui est courant. Par exemple, une véritable structure de données ne peut pas être obtenue si vous disposez de tous les composants architecturaux, tels que les sources de données et les analyses, mais aucun des API et des SDK. La structure de données fait référence à la conception de l'architecture, et non à une seule technologie. Et certaines des caractéristiques déterminantes de l'architecture sont l'interopérabilité entre les composants et la préparation à l'intégration.

Il est également essentiel pour l'organisation de comprendre ses exigences en matière de conformité et de réglementation. Une architecture de Data Fabric peut améliorer la sécurité, la gouvernance et la conformité réglementaire.

Étant donné que les données ne sont pas dispersées entre les systèmes, la menace d'exposition aux données sensibles est moindre. Cela dit, il est important de comprendre les exigences de conformité et réglementaires avant de mettre en œuvre une structure de données. Différents types de données peuvent relever de différentes juridictions réglementaires. Une solution consiste à utiliser des politiques de conformité automatisées qui garantissent que la transformation des données est conforme aux lois.

Cas d'utilisation de Data Fabric

Il existe de nombreuses utilisations différentes pour une structure de données, mais quelques-unes sont très courantes. Un tel exemple courant est la collecte virtuelle/logique d'actifs de données géographiquement diversifiés pour faciliter l'accès et l'analyse. La structure de données est généralement utilisée pour la gestion centralisée de l'entreprise dans ce cas. Étant donné que les opérations de ligne distribuées qui collectent et utilisent les données sont prises en charge par des applications traditionnelles et des interfaces d'accès/requête aux données, les organisations qui ont une segmentation régionale ou nationale de leurs activités ont beaucoup à gagner. Ces organisations nécessitent souvent une gestion et une coordination centralisées.

Un autre cas d'utilisation majeur des data fabrics est la mise en place d'un modèle de données unifié suite à une fusion ou une acquisition. Lorsque cela se produit, la base de données et les politiques de gestion des données de l'organisation auparavant indépendante changent souvent, ce qui signifie qu'il devient plus difficile de collecter des informations au-delà des frontières organisationnelles. Une structure de données peut surmonter ce problème en créant une vue unifiée des données qui permet à l'entité combinée de s'harmoniser sur un modèle de données unique.

 

Alex McFarland est un journaliste et écrivain en IA qui explore les derniers développements en matière d'intelligence artificielle. Il a collaboré avec de nombreuses startups et publications d'IA dans le monde entier.