Suivez nous sur

Interviews

Bryon Jacob, CTO et co-fondateur de data.world – Série d'entretiens

mm

Publié le

 on

Bryon Jacob est le CTO et co-fondateur de données.monde – avec pour mission de créer la ressource de données la plus significative, collaborative et abondante au monde. Avant de rejoindre data.world, il a passé dix ans à des postes à responsabilités croissantes chez HomeAway.com, aboutissant à un rôle de vice-président de la technologie / collègue technique. Bryon a également travaillé chez Amazon et est un mentor de longue date chez Capital Factory. Il est titulaire d'un BS/MS en informatique de l'Université Case Western.

Qu'est-ce qui vous a d'abord attiré vers l'informatique ?

Je suis accro au codage depuis que j'ai mis la main sur un Commodore 64 à l'âge de 10 ans. J'ai commencé avec le BASIC et je suis rapidement passé au langage assembleur. Pour moi, l’informatique, c’est comme résoudre une série d’énigmes complexes avec le plaisir supplémentaire de l’automatisation. C'est cet aspect de résolution de problèmes qui m'a toujours tenu engagé et excité.

Pouvez-vous partager l’histoire de la genèse de data.world ?

data.world est né d'une série de séances de brainstorming au sein de notre équipe fondatrice. Brett, notre PDG, a contacté Jon et Matt, avec qui il avait déjà travaillé auparavant. Ils ont commencé à se réunir pour échanger des idées, et Jon m'a apporté quelques-uns de ces concepts pour une évaluation technique. Même si ces idées n’ont pas abouti, elles ont suscité des discussions étroitement liées à mon propre travail. Grâce à ces conversations, nous avons eu l’idée qui est finalement devenue data.world. Notre histoire commune et notre respect mutuel nous ont permis de constituer rapidement une excellente équipe, en faisant appel aux meilleures personnes avec lesquelles nous avions travaillé dans le passé, et de jeter des bases solides pour l'innovation.

Qu'est-ce qui a inspiré data.world à développer l'AI Context Engine, et quels défis spécifiques répond-il aux entreprises ?

Dès le début, nous savions qu’un Knowledge Graph (KG) serait essentiel pour faire progresser les capacités de l’IA. Avec l’essor de l’IA générative, nos clients souhaitaient des solutions d’IA capables d’interagir de manière conversationnelle avec leurs données. L’explicabilité constitue aujourd’hui un défi important dans les applications d’IA. Si vous ne pouvez pas montrer votre travail, les réponses sont moins fiables. Notre architecture KG fonde chaque réponse sur des faits vérifiables, fournissant des explications claires et traçables. Cela améliore la transparence et la fiabilité, permettant aux entreprises de prendre des décisions éclairées en toute confiance.

Comment l'architecture de graphe de connaissances du moteur de contexte AI améliore-t-elle la précision et l'explicabilité des LLM par rapport aux bases de données SQL seules ?

Dans notre papier révolutionnaire, nous avons démontré une précision multipliée par trois en utilisant les Knowledge Graphs (KG) par rapport aux bases de données relationnelles traditionnelles. Les KG utilisent la sémantique pour représenter les données sous forme d'entités et de relations du monde réel, ce qui les rend plus précises que les bases de données SQL, qui se concentrent sur les tables et les colonnes. Pour des raisons d'explicabilité, les KG nous permettent de relier les réponses aux définitions de termes, aux sources de données et aux mesures, fournissant ainsi une piste vérifiable qui améliore la confiance et la convivialité.

Pouvez-vous partager quelques exemples de la manière dont AI Context Engine a transformé les interactions avec les données et la prise de décision au sein des entreprises ?

L'AI Context Engine est conçu comme une API qui s'intègre de manière transparente aux applications d'IA existantes des clients, qu'il s'agisse de GPT personnalisés, de copilotes ou de solutions sur mesure construites avec LangChain. Cela signifie que les utilisateurs n'ont pas besoin de passer à une nouvelle interface : nous leur apportons plutôt le moteur de contexte AI. Cette intégration améliore l'adoption et la satisfaction des utilisateurs, favorisant une meilleure prise de décision et des interactions de données plus efficaces en intégrant de puissantes capacités d'IA directement dans les flux de travail existants.

De quelle manière l’AI Context Engine assure-t-il la transparence et la traçabilité dans la prise de décision en matière d’IA afin de répondre aux exigences réglementaires et de gouvernance ?

Le moteur de contexte AI est lié à notre Knowledge Graph et à notre catalogue de données, exploitant les capacités liées au lignage et à la gouvernance. Notre plateforme suit le traçage des données, offrant une traçabilité complète des données et des transformations. Les réponses générées par l’IA sont connectées à leurs sources de données, fournissant une trace claire de la manière dont chaque élément d’information a été obtenu. Cette transparence est cruciale pour le respect de la réglementation et de la gouvernance, garantissant que chaque décision en matière d'IA peut être auditée et vérifiée.

Quel rôle voyez-vous jouer les graphes de connaissances dans le paysage plus large de l’IA et de la gestion des données dans les années à venir ?

Les Knowledge Graphs (KG) deviennent de plus en plus importants avec l’essor de l’IA générative. En formalisant les faits dans une structure graphique, les KG fournissent une base plus solide pour l’IA, améliorant à la fois la précision et l’explicabilité. Nous assistons à un passage des architectures RAG (Retrieval Augmented Generation) standard, qui reposent sur des données non structurées, aux modèles Graph RAG. Ces modèles convertissent d'abord le contenu non structuré en KG, ce qui entraîne des améliorations significatives en termes de rappel et de précision. Les KG sont appelées à jouer un rôle central dans la conduite des innovations et de l’efficacité de l’IA.

À quelles améliorations futures pouvons-nous nous attendre pour l'AI Context Engine afin d'améliorer encore ses capacités et son expérience utilisateur ?

Le moteur de contexte AI s'améliore au fil de son utilisation, à mesure que le contexte revient dans le catalogue de données, le rendant ainsi plus intelligent au fil du temps. Du point de vue du produit, nous nous concentrons sur le développement d'agents qui effectuent des tâches avancées d'ingénierie des connaissances, transformant le contenu brut en ontologies et bases de connaissances plus riches. Nous apprenons continuellement des modèles qui fonctionnent et intégrons rapidement ces informations, offrant ainsi aux utilisateurs un outil puissant et intuitif pour gérer et exploiter leurs données.

Comment data.world investit-il dans la recherche et le développement pour rester à la pointe des technologies d’IA et d’intégration de données ?

La R&D sur AI Context Engine est notre principal domaine d’investissement. Nous nous engageons à rester à la pointe de ce qui est possible en matière d’IA et d’intégration de données. Notre équipe, experte à la fois en IA symbolique et en apprentissage automatique, est à l’origine de cet engagement. La base solide que nous avons bâtie chez data.world nous permet d'évoluer rapidement et de repousser les limites technologiques, garantissant ainsi de fournir systématiquement des capacités de pointe à nos clients.

Quelle est votre vision à long terme de l’avenir de l’IA et de l’intégration des données, et comment voyez-vous data.world contribuer à cette évolution ?

Ma vision de l’avenir de l’IA et de l’intégration des données a toujours été d’aller au-delà de la simple possibilité pour les utilisateurs d’interroger plus facilement leurs données. Au lieu de cela, notre objectif est d’éliminer complètement la nécessité pour les utilisateurs d’interroger leurs données. Notre vision a toujours été d'intégrer de manière transparente les données d'une organisation à ses connaissances, englobant les métadonnées sur les systèmes de données et les modèles logiques d'entités du monde réel.

En réalisant cette intégration dans un graphe de connaissances lisible par machine, les systèmes d’IA peuvent véritablement tenir la promesse des interactions en langage naturel avec les données. Grâce aux progrès rapides de l’IA générative au cours des deux dernières années et à nos efforts pour l’intégrer aux graphes de connaissances d’entreprise, cet avenir devient aujourd’hui une réalité. Chez data.world, nous sommes à l'avant-garde de cette évolution, conduisant la transformation qui permet à l'IA d'offrir une valeur sans précédent grâce à des interactions de données intuitives et intelligentes.

Merci pour cette excellente interview, les lecteurs qui souhaitent en savoir plus devraient visiter données.monde.

Partenaire fondateur d'unite.AI et membre du Conseil technologique de Forbes, Antoine est un futuriste qui est passionné par l'avenir de l'IA et de la robotique.

Il est également le fondateur de Titres.io, un site Web axé sur l'investissement dans les technologies de rupture.