Angle d'Anderson

Utilisation de la « probabilité » comme métrique de détection des deepfakes

Publié 13 novembre 2025

Martin Anderson

Montage sur une image générée par IA (GPT-1) du Vésuve explosant en 79 après J.-C., avec Donald Trump de l'épisode 1 de la saison 27 de South Park, David Icke dans 'Wogan' en 1991 et la femme politique Catherine Connolly.

Si la qualité des vidéos et des fichiers audio générés par l'IA devient suffisamment bonne, les détecteurs de deepfakes basés sur les artefacts visuels ou d'autres signaux traditionnels deviendront inefficaces. Cependant, étant donné la rareté des écarts de comportement chez l'être humain, la notion de « probabilité » pourrait être davantage prise en compte pour évaluer la crédibilité d'une vidéo ou d'une rumeur.

Opinion Au début des années 1990, David Icke, ancien footballeur britannique respecté et commentateur sportif à la télévision révélé avec désinvolture Lors d'une émission de télévision, il a déclaré être « le fils de Dieu » – une révélation bizarre et inattendue qui allait se transformer au cours des décennies suivantes en une croyance persistante et théorie du complot élaborée à propos d'une cabale mondiale secrète et puissante de « reptiliens ».

L'adoption d'Internet étant encore à quelques années, et l'avènement des médias sociaux encore plus lointain, la dissonance flagrante entre la célébrité d'Icke et la nature de ses nouvelles réflexions a eu un impact profond sur le public britannique – notamment en raison de l'absence totale de contexte, ou de toute préparation à ce revirement majeur, de la part d'une personnalité sportive aussi connue et établie.

Plus de vingt ans plus tard, un choc social similaire et bien plus sombre s'est produit lorsque Jimmy Savile, militant caritatif et animateur de télévision pour enfants très apprécié, a été reconnu coupable à titre posthume de… délinquant sexuel en série et vorace, ayant commis toute sa vie un crime sexuel. qui avait utilisé son image publique irréprochable pour faciliter ses crimes.

Le suivant Opération Yewtree L'enquête policière allait révéler de nombreuses autres célébrités britanniques ayant un long passé d'agressions sexuelles ; plus tard, le procès d'Harvey Weinstein allait mener à une découverte similaire de célébrités agresseuses sexuelles aux États-Unis, donnant naissance au mouvement #metoo, qui s'est durablement ancré dans la culture américaine à travers des révélations telles que… Le spectacle du matinLes informations « chocs » semblaient développer un modèle nouveau et abrupt, qui allait finalement être adopté par les auteurs d'attaques utilisant des deepfakes.

La fin de la détection «traditionnelle» des deepfakes ?

Même si les médias sociaux et l'IA avaient existé au début des années 90, aucun système prédictif au monde n'aurait pu prévoir les révélations d'Icke dans son talk-show, qui (comme je m'en souviens très bien) n'avaient en aucun cas été annoncées dans les années précédant l'événement.

Mais alors, si l'IA avait existé à l'époque, il aurait peut-être fallu un certain temps pour convaincre un public plus large que les déclarations d'Icke n'étaient pas le fruit du hasard. Google Veo 3, ou un autre de ces nouveaux frameworks de deepfake audio/vidéo hyperréalistes.

Ce n'est qu'au cours des 6 à 12 derniers mois que les méthodes de deepfake basées sur l'IA sont devenues suffisamment efficaces pour répondre aux besoins. des années de prédictions catastrophistes des médias concernant l'ingérence électorale par deepfake, et suffisamment capable de générer le genre de tache de réputation à frappe rapide C'est faux, mais difficile à éradiquer dans une culture de plus en plus crédule.

À ce jour, la production vidéo par IA est généralement loin d'atteindre un réalisme véritable, limitée par obstacles techniques et de plus en plus polarisée par un fossé grandissant entre les modèles occidentaux restrictifs et les publications open source non censurées de la Chine^**.

Néanmoins, je constate de plus en plus dans la littérature scientifique une concession imminente de cette guerre froide, par exemple dans le nouvel article Dégradation des performances dans la détection des deepfakes^†:

Nous partons du principe que les vidéos truquées continueront de contenir des caractéristiques apprenables par machine qui les distinguent de manière fiable des vidéos authentiques. Cependant, à mesure que les capacités de l'IA générative progressent rapidement, cette hypothèse pourrait bien ne plus être vérifiée.

« Dans un tel scénario, le tatouage numérique et autres méthodes de traçabilité de la provenance seront le seul recours pour maintenir la confiance dans les médias numériques. »

Cependant, le même article concède que les solutions basées sur la provenance, telles que celles pilotées par Adobe, ne sont pas suffisantes. Initiative d'authenticité du contenu (et les très nombreux faibles Une étude des présents (des 7-8 dernières années) nécessitent une adoption si généralisée qu'elle en serait irréaliste ; et l'article se termine sur une note générale de recul, voire de défaite.

Si les méthodes de détection des deepfakes audiovisuels sont supplantées par l'IA générative, et si l'adoption mondiale d'un système de tatouage numérique ou de traçabilité intrusif se heurte à divers obstacles logistiques, quel élément central commun pourrait les remplacer comme indicateur de contenu potentiellement falsifié ? Ou devons-nous nous résigner à un monde où tous les médias sont sujets au doute, et où… Le dividende du menteur prévaut ?

Graphiques de connaissances

Il semble que le moment soit venu de tirer davantage parti de cette exploitation. probabilité et plausibilité L’analyse des « événements rapportés » comme caractéristique de détection des deepfakes est prometteuse. De plus, la convergence croissante des systèmes d’IA génératifs vidéo et audio pourrait également favoriser une convergence des recherches sur les « fausses nouvelles » (en tant qu’événement narratif textuel) et sur les images/vidéos truquées.

A probabilité La métrique des deepfakes n'est pas la même que CHIFFON-aidé vérification des faits, où un modèle d'IA peut exploiter les résultats web actuels pour acquérir des connaissances sur les événements survenus après son propre développement date limiteet/ou pour corroborer ses affirmations.

Il s'agirait plutôt d'effectuer des prédictions basées sur des tendances statistiques généralement indicatives, dérivées de schémas historiques conformes à l'enquête en cours.

En ce sens, une méthode probabiliste est plus proche de l'analyse statistique que les approches plus modernes dans le domaine actuel de l'apprentissage automatique.

Bien qu'ayant été auparavant éclipsées par les approches plus modernes de l'ère Transformers, graphiques de connaissances sont en train de faire quelque chose de reviens dans le secteur des entreprises, et semblent adaptées au déploiement potentiel de métriques de « probabilité » dans la détection des deepfakes.

Un graphe de connaissances simplifié illustrant comment les personnes, les lieux, les œuvres d'art et les événements peuvent être liés par des relations étiquetées, permettant aux machines de raisonner sur les entités du monde réel et leurs connexions. Source

Un graphe de connaissances est une manière d'organiser l'information en cartographiant des éléments du monde réel tels que des personnes, des entreprises, des événements ou des idées en un réseau de faits interconnectés.

Chaque sous-entité est un nœud, et les liens qui les unissent (arêtes) décrivent leurs relations. Par exemple, « Microsoft » (un nœud) peut être relié à « OpenAI » (un autre nœud) par une arête indiquant « est client de ». Ces connexions sont généralement stockées dans des bases de données graphiques et suivent une structure sujet-prédicat-objet, telle que « Microsoft est client d'OpenAI ».

Mémoire persistante

UN étude chinoise Une méthode sans formation, utilisant un raisonnement basé sur les graphes pour détecter les incohérences subtiles dans les deepfakes multimodaux, a été proposée en septembre de cette année.

Au lieu de générer des justifications ou réglage fin Pour les grands modèles, le système récupère des paires image-texte, construit un graphe de similarité et évalue les connexions afin de récupérer les exemples les plus pertinents, qui guident le jugement du modèle sans nécessiter de nouvel apprentissage :

Présentation du framework GASP-ICL, qui améliore la détection des deepfakes en combinant la sélection d'échantillons basée sur les graphes et l'apprentissage en contexte. Ce framework permet à un modèle vision-langage figé de classifier les paires image/texte comme réelles ou fausses, sans entraînement ni ajustement. Source : [https://www.arxiv.org/pdf/2509.21774]

Présentation du cadre GASP-ICL, qui améliore la détection des deepfakes en combinant la sélection d'échantillons basée sur des graphes avec l'apprentissage en contexte, permettant à un modèle vision-langage figé de classer les paires image/texte comme réelles ou fausses, sans entraînement ni réglage fin. Source

Il s'agit probablement de l'ouvrage le plus proche, en tout cas celui que j'ai rencontré, d'une approche « éclairée » et tenant compte du contexte historique de l'évaluation et de la vérification des productions des nouveaux médias. Dans l'ensemble, les approches de vision par ordinateur continuent d'analyser simples images. (y compris les images extraites de vidéos et anomalies temporelles englobant plusieurs cadres) tandis que les cadres de détection des « fausses nouvelles » continuent de mettre l'accent sur les données textuelles, même dans les projets multimodaux.

Fluage des fonctionnalités

Le défi que représente un système prédictif de ce type réside dans l'étendue de la surveillance qui pourrait s'avérer nécessaire pour que l'approche soit pleinement performante – du moins au-delà de l'analyse des célébrités et des personnalités publiques, pour lesquelles des données librement accessibles existent déjà.

Le domaine de recherche actuel le plus similaire est probablement celui de pré-crime, qui qualifie de « suspects » divers signaux d'intelligence multimodaux et se présente comme un épouvantail inébranlable de l'IA dans des productions telles que celle de Jonathan Nolan Person of Interest (2011-2016), et de Steven Spielberg Minority Report (2002).

Alors qu'une Person of InterestBien qu'un système de surveillance omnivore de type chinois puisse produire des résultats optimaux, il est peu probable à l'heure actuelle que la culture occidentale puisse approuver le niveau d'intrusion personnelle que les réseaux internes chinois imposent à leurs citoyens.

Par conséquent, en ce qui concerne les potentielles fausses informations sur non- les célébrités, seules les agences gouvernementales telles que la police (ainsi que les registres des naissances et des décès et les bureaux des impôts) disposeraient de suffisamment d'informations historiques pertinentes pour éclairer les probabilités dans un flux de travail basé sur un graphique ; et même elles auraient besoin de la volonté, de la capacité, de la législation et des ressources du style de l'URSS pour inclure les citoyens moyens dans leur couverture et leurs analyses (c'est-à-dire au-delà des points de données banals mais obligatoires tels que les numéros de passeport et les immatriculations de voitures).

Score de probabilité

Il semble probable que l'efficacité potentielle d'un système de ce type se limiterait aux cas d'utilisation les plus évidents (actuels).^††† pour le contenu deepfake : déstabilisation (deepfakes soutenus par l'État) ; deepfakes pornographiques de célébrités et d'« inconnus » (les deux cas pouvant être considérés comme malveillants, bien que le second ait tendance à susciter une plus grande inquiétude médiatique) ; fraude (Y compris deepfakes audio/vidéo conçu pour performer « vols par usurpation d'identité »); et diffamation politique.

Un système basé sur la connaissance nécessiterait une échelle de probabilités pour une diversité d'événements possibles. À une extrémité du spectre, des faiblesses humaines courantes telles qu'une mauvaise gestion financière, l'infidélité, la dépendance, l'indiscrétion, etc. ; à l'autre… révéler que l'on est le fils de Dieu en direct à la télévision (ou des événements d'une ampleur et d'un impact similaires).

Même dans ce dernier cas, les facteurs historiques personnels de chaque individu influenceraient la probabilité du résultat : une personnalité politique de premier plan ayant publiquement tergiversé sur des sujets controversés (comme la véracité des alunissages des années 1960/70) pour accroître son influence. informé de manière « alternative » l'électorat pourrait obtenir des gains supplémentaires générique leur statut dans les routines de vérification, comparé à celui de leurs homologues plus traditionnels.

Dans le cas du porno avec des célébrités, il existe un contexte réel adéquat (c'est-à-dire, le Fuites de photos de célébrités de 2012, parmi d'autres incidents – assez rares –) pour générer un dividende du menteur modéré, dans certains contextes ; mais comme ces incidents atypiques ont tendance à fonctionner comme des exceptions confirmant la règle, la plupart des vidéos pornographiques de célébrités diffusées actuellement seraient considérées comme extrêmement « improbables » (bien que cela ne résolve pas le problème de l'appropriation de l'identité des personnes à de telles fins).

En matière de perturbations nationales, il existe une quantité considérable de données statistiques permettant d'évaluer les probabilités de rapports faisant état de catastrophes. Même dans l'Antiquité, des événements apparemment imprévus, tels que l'éruption du Vésuve en 79 après J.-C., volcan non identifié, étaient prédits. si vous aviez prêté suffisamment attention; et outre la disponibilité d'une pléthore de flux d'informations provenant de gouvernements et d'ONG, la capacité croissante de l'IA à extraire la structure des données brutes peut fournir un contexte historique supplémentaire pour le calcul des probabilités.

Conclusion

Même un système prédictif de ce type, aussi bien conçu soit-il, ne pourrait pas tenir compte du hasard, des cas de force majeure, des événements imprévus ou des actes malveillants ourdis à l'abri de tout contrôle.

De plus, le volume et la profondeur des données nécessaires pour couvrir également les personnes non célèbres constitueraient un obstacle politique majeur – du moins pour le moment.

Cependant, les options semblent se restreindre ; l’analyse visuelle est vouée à l’échec face aux progrès de l’IA générative, tandis que les systèmes de vérification et de provenance sont alourdis par une dette technique considérable et freinent leur adoption. Cela rend des solutions comme la Content Authenticity Initiative et le système de reconnaissance faciale Metaphysic.ai, resté inachevé, obsolètes. Métaphysique Pro, difficile à populariser.

Dans leur acception la plus large, les systèmes RAG ne peuvent déterminer que si une source faisant autorité appuie une affirmation non vérifiée ; et comme de nombreuses informations importantes (véridiques) émergent sans contexte préalable, l'absence de justification de la part de sources faisant autorité n'est pas nécessairement significative.

Leur valeur pourrait s'avérer plus grande si elles pouvaient s'intégrer à un écosystème de données plus vaste, préoccupé par ce qui pose le plus de problèmes à la plupart des formes actuelles d'IA : le contexte historique.

* À ne pas confondre avec les premiers encodeur automatique des sorties qui ont débuté en 2017 et qui allaient finalement être supplantées par des approches supérieures.

^†https://arxiv.org/abs/2511.07009

^**Qui peuvent généralement fonctionner librement sur des PC personnels plus puissants, au lieu d'être uniquement disponibles via des API à accès restreint telles que ChatGPT et la série Veo.

^†††Sont exclus les usages légitimes à des fins de divertissement, tels que les effets visuels professionnels dans les productions cinématographiques et télévisuelles.

Première publication : jeudi 13 novembre 2025

Rubriques connexes:LLM avancés deepfake détection de deepfake DeepFakes

Martin Anderson

Rédacteur en apprentissage automatique, spécialiste du domaine de la synthèse d'images humaines. Ancien responsable du contenu de recherche chez Metaphysic.ai.
Site personnel : martinanderson.ai
Contact [email protected]
Twitter : @manders_ai