Suivez nous sur

Interviews

Carl Rost, consultant principal chez Patsnap – Série d'entretiens

mm
Le kit de préparation mis à jour on

Carl Rost est l'esprit derrière les outils de recherche de brevets basés sur l'IA de Patsnap.

Patsnap est à l'avant-garde de l'intelligence de l'innovation, exploitant la puissance de l'IA et de l'apprentissage automatique pour passer au crible des milliards d'ensembles de données, permettant ainsi aux innovateurs d'établir des liens cruciaux. Leur technologie LLM de pointe, conçue pour les professionnels de la R&D et de la propriété intellectuelle, parcourt quotidiennement des milliards de pages de brevets sans effort. L'assistant IA de Patsnap participe à des réponses conversationnelles à des questions de nouveauté et peut identifier des réponses spécifiques dans des textes détaillés. Par exemple, il peut déterminer avec précision si un type de widget particulier est déjà breveté.

Pouvez-vous donner un aperçu du fonctionnement de l'assistant IA de Patsnap et de ses principales fonctions ?

Bien sûr! Il s'agit d'un assistant IA appelé Hiro qui vous permet de poser des questions sur un brevet spécifique ou même sur un ensemble de résultats ou sur l'ensemble de notre base de données ! Il a été formé pour comprendre les questions liées à l'innovation et aux brevets et y répondre de manière à satisfaire les experts techniques en la matière et les professionnels de la propriété intellectuelle. Une avancée récente est que Hiro peut même vous aider à résoudre des problèmes techniques et à proposer de nouvelles orientations pour de nouvelles inventions en appliquant des principes inventifs aux solutions et problèmes techniques trouvés dans notre base de données de brevets et de littérature. Hiro fonctionne un peu différemment selon que vous l'utilisez dans nos produits destinés à la R&D ou aux professionnels de la propriété intellectuelle.

Je pense que ce qui rend Hiro unique, c'est qu'il est alimenté par le LLM exclusif de Patsnap, les réponses relient également les références et les sources de la bibliothèque de Patsnap de 200 millions de brevets, 190 millions de documents littéraires, 254 millions de structures chimiques, 879 millions de séquences biologiques et 2 milliards d'articles de presse. .

Quels problèmes cette application résout-elle pour les entreprises ?

Les grands innovateurs devraient consacrer leur temps à innover, sans déterminer la nouveauté des produits ni effectuer des recherches préliminaires sur le marché. Les données sur les brevets constituent l’une de nos sources d’informations techniques les plus riches, rivalisant avec les données des journaux, en particulier dans certains domaines technologiques. Pour la R&D, le temps nécessaire pour trouver et interroger ce type de données a constitué un obstacle majeur à l'exploitation de cette fonctionnalité, mais des outils comme Hiro peuvent véritablement démocratiser ce type d'informations pour la première fois.

Pour les professionnels du droit, il est courant de passer des heures, des jours, des semaines à effectuer des recherches sur l'état de la technique et la liberté d'opérer. Grâce aux outils d’IA, cela peut être réalisé plus rapidement et avec plus de précision, libérant ainsi de la bande passante pour un travail plus stratégique.

Les outils d’IA existants sont soit trop généralisés et donc inadaptés au domaine de la propriété intellectuelle, soit ce sont des boîtes noires, sans transparence quant aux ressources, réduisant la confiance et entravant la prise de décision. Avec Hiro, nous établissons des liens vers les sources et garantissons une visibilité totale à toutes les étapes du processus de développement.

Quels ont été les principaux défis auxquels votre équipe a été confrontée lors du développement des fonctionnalités d'IA pour Patsnap, et comment les avez-vous surmontés ?

Nous savons que les personnes qui créent de nouvelles inventions veulent les protéger, c'est pourquoi la sécurité était une priorité lors de la construction de Hiro. Comme le modèle qui alimente Hiro est local et intégré à notre application, aucune donnée ne laisse l'environnement à des tiers difficiles à faire confiance. Nos concurrents n'ont pas fait le travail de base et se sont tournés vers des modèles tiers qui ne résistent pas à un examen minutieux. Lorsque nous disons que nous ne formons pas de modèles sur les données clients, nous savons que cela est vrai et pouvons montrer à nos clients cela et ce que nous faisons à la place. En revanche, les solutions de nos concurrents vous exposent à des risques liés à des tiers dont la réputation est loin d'être excellente, en termes de transparence et de traitement des données.

Pourriez-vous nous expliquer comment Hiro répond à des questions spécifiques sur la nouveauté et l'impact que cela a sur les flux de travail de R&D et de propriété intellectuelle ?

Avec Hiro, les utilisateurs peuvent poser des questions telles que « Quels aspects de cette invention la rendent nouvelle ? » ou "Comment ce brevet pourrait-il résister dans différents systèmes juridiques ?" ou même « comment construire un jetpack portable » et obtenez des réponses qui parlent de chaque étape du processus d'invention. Comparé aux modèles généralistes, Hiro comprend vraiment ce qui rend un brevet spécial. Les utilisateurs n'ont pas besoin d'être des experts en brevets pour aller au fond de ce qui est ou n'est pas nouveau dans leur invention, et peuvent comprendre en quelques secondes quelle partie de leur produit ou outil doit être protégée.

Comment Hiro gère-t-il la grande quantité de données provenant des brevets et de la littérature non-brevet pour fournir des réponses précises et pertinentes ?

Nous avons suivi une formation approfondie sur cet ensemble de données et évalué les réponses avec des experts. Nous avons ensuite formé l'IA sur les réponses des experts, avons évalué les résultats de l'IA et avons demandé à des experts de l'examiner. Au total, nous avons évalué des millions de points de données de cette façon pour garantir que les réponses soient significatives pour les experts en technologie et les professionnels des brevets.

Comment Hiro utilise-t-il les grands modèles linguistiques (LLM) pour améliorer l'efficacité des recherches de brevets et de l'analyse de la propriété intellectuelle ? Quels types de données ont été utilisés pour former le LLM exclusif de Patsnap, et comment garantissez-vous son exactitude et sa fiabilité ?

Patsnap a construit un LLM spécifique à l'industrie pour propulser Hiro. Le LLM a été formé sur les dossiers de brevets, les articles universitaires et d'autres données d'innovation, ce qui l'aide à comprendre et à raconter les informations d'une manière plus utile aux professionnels que les modèles généralistes. Pour garantir l'exactitude et la fiabilité, nous avons utilisé des méthodes rigoureuses de prétraitement des données, notamment le filtrage des données de mauvaise qualité, la déduplication et la réécriture. Nous avons également synthétisé de nouvelles données en combinant différentes sources pour améliorer la compréhension du modèle des nuances spécifiques à la propriété intellectuelle. Nous avons supervisé la mise au point et l'apprentissage par renforcement à partir des commentaires humains pour améliorer continuellement ses performances.

PatsnapGPT a été testé de manière approfondie et a surpassé GPT-4 dans les tâches spécifiques à la propriété intellectuelle, démontrant des capacités supérieures en matière de rédaction, de classification, de résumé et de raisonnement dans le domaine des brevets.

Le LLM propriétaire est transparent, reliant les sources et les références, et il n'est pas formé sur les données clients. C'est le seul acteur du secteur à utiliser un LLM optimisé en interne, dans un secteur particulièrement dépendant de la confidentialité des données.

Comment le LLM propriétaire de Patsnap se compare-t-il à d'autres LLM à usage général comme GPT-4 en termes de performances et de précision pour les tâches liées à la propriété intellectuelle ?

Le LLM propriétaire de Patsnap surpasse GPT-4 en ce qui concerne les requêtes de propriété intellectuelle. Grâce à l'examen du barreau des brevets de l'USPTO, les PatsnapGPT-1.0 ont obtenu des résultats au niveau d'un expert en propriété intellectuelle, tandis que les LLM généraux n'ont pas atteint le seuil requis pour les avocats en brevets qui passent l'examen.

PatsnapGPT se démarque vraiment lorsque l'on examine ses performances dans les benchmarks spécifiques à la propriété intellectuelle. Hiro obtient systématiquement des résultats plus élevés que les modèles généraux comme GPT-4 à l'examen du barreau des brevets de l'USPTO. Les LLM généraux ne réussissent pas le seuil de 70 points à l'examen, tandis que PatsnapGPT 1.0 a obtenu un score au niveau d'un expert en propriété intellectuelle. Cela montre qu’il a une meilleure compréhension des principes fondamentaux de la propriété intellectuelle. De plus, dans PatentBench, qui est une référence complète pour les tâches de propriété intellectuelle, PatsnapGPT a excellé dans plusieurs domaines. Il a produit des textes plus précis et plus pertinents pour la rédaction des brevets, a obtenu de meilleurs résultats dans la classification des brevets selon le système de classification internationale des brevets, et ses résumés des effets techniques, des problèmes, des méthodes et des résumés ont été systématiquement mieux notés par les évaluateurs. Il affiche également des vitesses plus rapides et une utilisation de la mémoire inférieure par rapport au GPT-4 pour les documents de brevet longs.

Comment envisagez-vous l’évolution du rôle de l’IA dans le domaine de la propriété intellectuelle et de la recherche et développement au cours de la prochaine décennie ?

Je vois l’IA jouer un rôle de plus en plus central dans la propriété intellectuelle et la recherche et développement au cours de la prochaine décennie. D’une part, l’IA améliorera considérablement l’efficacité et la précision des recherches et des analyses de brevets. Les modèles d'IA avancés comme PatsnapGPT deviendront encore meilleurs pour comprendre et catégoriser des documents techniques complexes, rédiger des spécifications de brevet de haute qualité et identifier les violations ou chevauchements potentiels dans les brevets existants. Cela permettra d’économiser énormément de temps et de réduire la marge d’erreur humaine.

De plus, l’IA va révolutionner la façon dont nous traitons et interprétons de grandes quantités de données IP. Grâce à sa capacité à traiter et à analyser rapidement de grands ensembles de données, l’IA peut découvrir des tendances et des informations qui autrement pourraient passer inaperçues. Cela peut éclairer une meilleure prise de décision et une meilleure stratégie en matière de gestion de la propriété intellectuelle et de R&D, par exemple en identifiant les technologies émergentes, les domaines potentiels d’innovation et les partenariats stratégiques.

En R&D, l’IA stimulera l’innovation en facilitant le processus de découverte. Les algorithmes d’apprentissage automatique peuvent analyser des recherches antérieures, prédire les résultats et même suggérer de nouvelles pistes de recherche, accélérant ainsi le rythme de la découverte et du développement. L’IA peut également simuler des expériences et modéliser des systèmes complexes, réduisant ainsi le besoin d’essais physiques longs et coûteux.

À mesure que la technologie de l’IA continue d’évoluer, son intégration dans la propriété intellectuelle et la R&D améliorera la créativité, l’efficacité et la planification stratégique.

Merci pour cette excellente interview, les lecteurs qui souhaitent en savoir plus devraient visiter Patsnap

Partenaire fondateur d'unite.AI et membre du Conseil technologique de Forbes, Antoine est un futuriste qui est passionné par l'avenir de l'IA et de la robotique.

Il est également le fondateur de Titres.io, un site Web axé sur l'investissement dans les technologies de rupture.