J'ai testé 4 détecteurs de texte IA pendant un mois : le bilan honnête
GPTZero, Originality.ai, Copyleaks, Winston AI passés au crible sur 50 textes humains et IA. Faux positifs, contournements, ce que ces outils valent vraiment en 2026.
En bref : Après un mois de tests sur 50 textes, GPTZero, Originality.ai, Copyleaks et Winston AI repèrent environ 80 % des textes IA bruts, mais multiplient les faux positifs sur des textes humains et échouent sur les contenus reformulés à la main. Ce sont des indicateurs d'alerte, jamais des preuves fiables.
Plusieurs clients m'ont demandé en 2025-2026 : "Comment vérifier qu'un texte n'a pas été écrit par ChatGPT ?" Enseignants, responsables éditoriaux, recruteurs, agences SEO. J'ai donc passé un mois à tester sérieusement les quatre principaux détecteurs du marché sur un corpus mixte. Voici ce que ces outils savent faire, et surtout ce qu'ils ne savent toujours pas faire en mai 2026.
Mon protocole de test
J'ai construit un corpus de 50 textes :
- 20 textes humains certifiés (mes propres articles avant l'arrivée de GPT, des textes publiés par des journalistes connus, des extraits universitaires sourcés).
- 20 textes 100 % IA non retouchés (générés avec ChatGPT, Claude, Gemini sur des sujets variés).
- 10 textes "hybrides" (IA reformulée à la main pendant 10 minutes par un rédacteur).
Chaque texte a été soumis aux quatre outils, le même jour, avec les paramètres par défaut. J'ai noté le score, le verdict ("IA" ou "humain") et la confiance déclarée.
Comment fonctionnent ces détecteurs (en pratique)
Tous s'appuient sur deux mesures principales, dont la théorie est bien documentée par les équipes de recherche elles-mêmes.
La perplexité mesure à quel point chaque mot est "prévisible" dans son contexte. Les textes IA tendent à choisir des suites de mots statistiquement attendues. Un humain prend plus de risques lexicaux.
La burstiness mesure l'alternance entre phrases courtes et longues. Les humains varient davantage la longueur, les modèles IA produisent des structures plus homogènes.
Ces deux signaux combinés donnent un score. Le problème : ces signaux sont contournables et imparfaits, et les détecteurs eux-mêmes le reconnaissent dans leurs documentations.
Mes résultats sur les quatre outils
GPTZero : le plus connu. Sur mon corpus, il a correctement classé 17 textes IA sur 20, mais 5 textes humains sur 20 ont été signalés à tort comme "probablement IA". Les faux positifs concernaient surtout mes textes techniques écrits de façon structurée et factuelle. La version accessible est suffisante pour un test ponctuel, l'API permet d'automatiser.
Originality.ai : positionné sur le SEO, combine détection IA et plagiat. Sur mon corpus, il a été plus sévère : 19 IA sur 20 détectés, mais aussi 8 humains sur 20 mal classés. Très utile pour vérifier le plagiat en parallèle, mais le taux de faux positifs disqualifie son usage comme preuve.
Copyleaks : orienté entreprise et éducation, dashboard équipe. Performance proche de GPTZero sur mon corpus, avec une interface plus pensée pour des audits récurrents. conditions clairement supérieur.
Winston AI : visé pédagogique, interface enseignants. Sur mes textes universitaires authentiques (extraits de thèses publiées avant 2022), il a signalé 4 sur 10 comme "probablement IA". Inacceptable pour sanctionner un étudiant sur cette base.
Sur les textes hybrides (IA reformulée 10 minutes à la main), aucun des quatre outils n'a dépassé 60 % de détection correcte.
Ce que ça signifie pour les usages réels
Enseignants : un détecteur ne peut pas constituer une preuve disciplinaire. Les études publiées en 2023-2024 sur les biais des détecteurs envers les textes d'étudiants non-natifs anglais sont sans équivoque. La bonne approche reste l'évaluation pédagogique : oral, devoirs réalisés en présentiel, vérification de la compréhension réelle.
Éditeurs et responsables SEO : Google a confirmé en 2023 que c'est la qualité du contenu qui compte, pas la méthode de production. Un texte IA utile, original, vérifié et édité peut très bien se positionner. Un texte IA générique sera filtré comme n'importe quel contenu faible. Mon constat de terrain : les sites pénalisés en 2024-2025 par le Helpful Content Update n'avaient pas été pénalisés pour usage d'IA, mais pour absence d'apport.
Recruteurs : une lettre IA détectée révèle surtout un manque de personnalisation. C'est un signal faible sur la motivation, pas une preuve. L'entretien tranche.
Agences de contenu : la détection IA dans une livraison client est légitime, mais elle doit servir à demander une réécriture, pas à briser le contrat. Les détecteurs ont trop d'erreurs pour être normatifs.
Les contournements qui marchent
J'ai testé en parallèle les méthodes de contournement les plus citées :
- Reformulation manuelle ciblée des transitions et des conclusions : suffit à faire chuter le score IA sous 30 % chez tous les outils.
- Utilisation d'un outil de "humanisation" automatique (Undetectable.ai, StealthGPT) : efficace sur GPTZero et Copyleaks, moins sur Originality.
- Mélanger des phrases personnelles vraies avec une trame IA : indétectable à coup sûr.
La conclusion logique : tout texte IA correctement réécrit passe sous les radars. Tout texte IA brut sera repéré environ 80 % du temps.
Ma position honnête
Les détecteurs IA sont des indicateurs, jamais des preuves. Les utiliser comme preuve pour sanctionner ou refuser quelqu'un est juridiquement et éthiquement fragile, vu le taux d'erreur documenté. Je les recommande comme outil d'alerte interne dans une chaîne éditoriale, pas comme arbitre.
Pour évaluer la qualité d'un outil IA plutôt que d'un texte, mon retour sur le Trust Score et ma checklist RGPD couvrent les vraies questions à se poser avant d'adopter un outil dans une organisation.
Pour approfondir ce sujet
Comparer les outils IA
Comparer les outils par usage, catégorie et critères de confiance.
Trust Ranking
Voir les signaux de fiabilité, transparence et maturité produit.
IA SEO : optimiser le contenu
Structurer les contenus pour Google, les moteurs de réponse et les lecteurs.
Outils IA marketing contenu
Panorama éditorial pour rédaction, publication, analyse et automatisation marketing.
Sources officielles et méthode
Trust-Vault croise les usages terrain avec des sources institutionnelles pour renforcer la vérification, la conformité et la lisibilité des comparatifs.
- Google Search Central - helpful content - Google. Repères officiels sur le contenu utile, fiable et rédigé pour les lecteurs.
- Google Search Central - structured data - Google. Documentation officielle pour comprendre les données structurées reconnues par Google Search.
- The /llms.txt file - llmstxt.org. Proposition publique de format Markdown pour aider les moteurs IA à comprendre un site.
- Artificial Intelligence - Federal Trade Commission. Repères de l'autorité américaine sur les usages IA, les promesses commerciales et la protection des consommateurs.
Laurent Duplat
Directeur de la publication — Trust-Vault