Suivez nous sur

Interviews

Yashar Behzadi, PDG de Synthesis AI – Série d'interviews

mm

Publié le

 on

Yashar Behzadi PhD est le PDG et fondateur de Synthèse AI. C'est un entrepreneur expérimenté qui a créé des entreprises transformatrices sur les marchés de l'IA, de la technologie médicale et de l'IdO. Il a passé les 14 dernières années dans la Silicon Valley à créer et à développer des entreprises technologiques centrées sur les données. Yashar a plus de 30 brevets et brevets en instance et un doctorat. de l'UCSD avec un accent sur la modélisation spatio-temporelle de l'imagerie cérébrale fonctionnelle.

Synthèse AI est une startup à l'intersection du deep learning et du CGI, créant un nouveau paradigme pour le développement de modèles de vision par ordinateur. Ils permettent aux clients de développer de meilleurs modèles en une fraction du temps et du coût des approches traditionnelles basées sur l'annotation humaine.

Comment avez-vous commencé à vous intéresser à l'informatique et à l'IA ?

J'ai obtenu un doctorat. de l'UCSD en 2006, il s'est concentré sur la vision par ordinateur et la modélisation spatiale et temporelle des données d'imagerie cérébrale. J'ai ensuite travaillé dans la Silicon Valley à l'intersection des capteurs, des données et de l'apprentissage automatique dans tous les secteurs pendant les 16 années suivantes. Je me sens très chanceux d'avoir l'opportunité de travailler sur des technologies remarquables et j'ai plus de 30 brevets délivrés ou déposés axés sur le traitement du signal, l'apprentissage automatique et la science des données.

Pourriez-vous partager l'histoire de la genèse de Synthesis AI ?

Avant de fonder Synthesis AI en 2019, j'ai dirigé une société mondiale de services d'IA axée sur le développement de modèles de vision par ordinateur pour les principales entreprises technologiques. Quelle que soit la taille de l'entreprise, j'ai trouvé que nous étions extrêmement limités par la qualité et la quantité de données de formation étiquetées. Au fur et à mesure que les entreprises se développaient géographiquement, élargissaient leur clientèle ou développaient de nouveaux modèles et du nouveau matériel, de nouvelles données de formation étaient nécessaires pour garantir que les modèles fonctionnaient correctement. Il est également devenu clair que l'avenir de la vision par ordinateur ne serait pas couronné de succès avec le paradigme d'annotation humain dans la boucle d'aujourd'hui. Les applications émergentes de vision par ordinateur dans l'autonomie, la robotique et les applications AR/VR/métavers nécessitent un riche ensemble d'étiquettes 3D, d'informations de profondeur, de propriétés matérielles, de segmentation détaillée, etc., que les humains ne peuvent pas étiqueter. Un nouveau paradigme était nécessaire pour fournir le riche ensemble d'étiquettes nécessaire à la formation de ces nouveaux modèles. En plus des moteurs techniques, nous avons constaté une surveillance croissante des consommateurs et des autorités réglementaires autour des questions éthiques liées aux biais de modèle et à la vie privée des consommateurs.

J'ai créé Synthesis AI dans le but de transformer le paradigme de la vision par ordinateur. La plate-forme de génération de données synthétiques de la société permet la génération à la demande de données d'images photoréalistes avec un ensemble étendu d'étiquettes 3D au pixel près. Notre mission est d'être pionnier dans les technologies de données synthétiques pour permettre le développement éthique de modèles plus performants.

Pour les lecteurs qui ne connaissent pas ce terme, pourriez-vous définir ce qu'est une donnée synthétique ?

Les données synthétiques sont des données générées par ordinateur qui servent d'alternative aux données du monde réel. Les données synthétiques sont créées dans des mondes numériques simulés plutôt que collectées ou mesurées dans le monde réel. Combinant des outils du monde des effets visuels et du CGI avec des modèles d'IA génératifs, Synthesis AI permet aux entreprises de créer de grandes quantités de données photoréalistes et diverses à la demande pour former des modèles de vision par ordinateur. La plate-forme de génération de données de l'entreprise a réduit le coût et la vitesse d'obtention de données d'image de haute qualité par ordre de grandeur tout en préservant la confidentialité.

Pourriez-vous expliquer comment les données synthétiques sont générées ?

Un ensemble de données synthétiques est créé artificiellement plutôt que par le biais de données du monde réel. Les technologies de l'industrie des effets visuels sont couplées à des réseaux de neurones génératifs pour créer des données d'image étiquetées vastes, diverses et photoréalistes. Les données synthétiques permettent de créer des données de formation à une fraction du coût et du temps des approches actuelles.

En quoi l'exploitation des données synthétiques crée-t-elle un avantage concurrentiel ?

Actuellement, la plupart des systèmes d'IA s'appuient sur «l'apprentissage supervisé» où les humains étiquettent la clé attribuée dans les images, puis forment des algorithmes d'IA pour interpréter les images. Il s'agit d'un processus qui demande beaucoup de ressources et de temps et qui est limité par ce que les humains peuvent étiqueter avec précision. De plus, les préoccupations concernant les biais démographiques de l'IA et la confidentialité des consommateurs se sont amplifiées, ce qui rend de plus en plus difficile l'obtention de données humaines représentatives.

Notre approche consiste à créer des mondes numériques photoréalistes qui synthétisent des données d'images complexes. Puisque nous générons les données, nous savons tout sur les scènes, y compris des informations inédites sur l'emplacement 3D des objets et leurs interactions complexes entre eux et avec l'environnement. L'acquisition et l'étiquetage de cette quantité de données à l'aide des approches actuelles prendraient des mois, voire des années. Ce nouveau paradigme permettra une amélioration de 100 fois de l'efficacité et des coûts et conduira à une nouvelle classe de modèles plus performants.

Étant donné que les données synthétiques sont générées artificiellement, cela élimine de nombreux biais et problèmes de confidentialité liés à la collecte traditionnelle d'ensembles de données du monde réel.

Comment la génération de données à la demande permet-elle une mise à l'échelle accélérée ?

La capture et la préparation de données du monde réel pour la formation de modèles est un processus long et fastidieux. Le déploiement du matériel nécessaire peut être d'un coût prohibitif pour les systèmes de vision par ordinateur complexes comme les véhicules autonomes, la robotique ou l'imagerie par satellite. Une fois les données capturées, les humains étiquettent et annotent les caractéristiques essentielles. Ce processus est sujet aux erreurs et les humains sont limités dans leur capacité à étiqueter des informations clés telles que la position 3D requise pour de nombreuses applications.

Les données synthétiques sont des ordres de grandeur plus rapides et moins chères que les approches traditionnelles de données réelles annotées par l'homme et viendront accélérer le déploiement de nouveaux modèles plus performants dans tous les secteurs.

Comment les données synthétiques permettent-elles de réduire ou de prévenir les biais de l'IA ?

Les systèmes d'IA sont omniprésents mais peuvent contenir des biais inhérents qui peuvent avoir un impact sur des groupes de personnes. Les ensembles de données peuvent être déséquilibrés avec certaines classes de données et des groupes de personnes surreprésentés ou sous-représentés. La construction de systèmes centrés sur l'humain peut souvent conduire à des préjugés liés au sexe, à l'ethnicité et à l'âge. En revanche, les données de formation générées par la conception sont correctement équilibrées et manquent de biais humains.

Les données synthétiques pourraient devenir une solution robuste pour résoudre le problème de biais de l'IA. Les données synthétiques sont générées partiellement ou complètement artificiellement plutôt que mesurées ou extraites d'événements ou de phénomènes du monde réel. Si l'ensemble de données n'est pas suffisamment diversifié ou volumineux, les données générées par l'IA peuvent combler les trous et former un ensemble de données impartial. La meilleure partie? La création manuelle de ces ensembles de données peut prendre plusieurs mois ou années aux équipes. Lorsqu'il est conçu avec des données synthétiques, cela peut être fait du jour au lendemain.

En dehors de la vision par ordinateur, quels sont les futurs autres cas d'utilisation potentiels des données synthétiques ?

En plus de la multitude de cas d'utilisation de la vision par ordinateur liés aux produits de consommation, à l'autonomie, à la robotique, à l'AR/VR/métaverse, etc., les données synthétiques auront également un impact sur d'autres modalités de données. Nous voyons déjà des entreprises exploiter des approches de données synthétiques pour le traitement des données tabulaires structurées, de la voix et du langage naturel. Les technologies sous-jacentes et les pipelines de génération diffèrent pour chaque modalité, et dans un avenir proche, nous nous attendons à voir des systèmes multimodaux (par exemple, vidéo + voix).

Y a-t-il autre chose que vous aimeriez partager à propos de Synthesis AI ?

À la fin de l'année dernière, nous avons publié API humaine, une extension significative des capacités de données synthétiques de Synthesis AI permettant la génération programmatique de millions d'humains numériques 3D uniques et de haute qualité. Cette annonce intervient des mois après le lancement du produit de données synthétiques en tant que service FaceAPI, qui a fourni plus de 10 millions d'images faciales étiquetées pour les principales entreprises de smartphones, de téléconférence, d'automobile et de technologie. HumanAPI est la prochaine étape du parcours de l'entreprise pour prendre en charge les applications avancées d'intelligence artificielle (IA) de vision par ordinateur.

HumanAPI offre également une myriade de nouvelles opportunités à nos clients, notamment des assistants IA intelligents, des entraîneurs de fitness virtuels et, bien sûr, le monde des applications métavers.

En créant un double numérique du monde réel, le métaverse permettra de nouvelles applications allant des réseaux sociaux réinventés, des expériences de divertissement, des téléconférences, des jeux, etc. L'IA de vision par ordinateur sera fondamentale pour la façon dont le monde réel est capturé et recréé avec une haute fidélité dans le domaine numérique. Des humains photoréalistes, expressifs et précis sur le plan comportemental seront un élément essentiel de l'avenir des applications de vision par ordinateur. HumanAPI est le premier produit permettant aux entreprises de créer à la demande de grandes quantités de données corporelles parfaitement étiquetées pour créer des modèles d'IA plus performants, notamment l'estimation de la pose, la reconnaissance des émotions, la caractérisation de l'activité et du comportement, la reconstruction faciale, etc.

Merci pour cette excellente interview, les lecteurs qui souhaitent en savoir plus devraient visiter Synthèse AI.

Partenaire fondateur d'unite.AI et membre du Conseil technologique de Forbes, Antoine est un futuriste qui est passionné par l'avenir de l'IA et de la robotique.

Il est également le fondateur de Titres.io, un site Web axé sur l'investissement dans les technologies de rupture.