J'ai testé 4 détecteurs de texte IA pendant un mois : le bilan honnête
GPTZero, Originality.ai, Copyleaks, Winston AI passés au crible sur 50 textes humains et IA. Faux positifs, contournements, ce que ces outils valent vraiment en 2026.
En bref : Après un mois de tests sur 50 textes, GPTZero, Originality.ai, Copyleaks et Winston AI repèrent environ 80 % des textes IA bruts, mais multiplient les faux positifs sur des textes humains et échouent sur les contenus reformulés à la main. Ce sont des indicateurs d'alerte, jamais des preuves fiables.
Plusieurs clients m'ont demandé en 2025-2026 : "Comment vérifier qu'un texte n'a pas été écrit par ChatGPT ?" Enseignants, responsables éditoriaux, recruteurs, agences SEO. J'ai donc passé un mois à tester sérieusement les quatre principaux détecteurs du marché sur un corpus mixte. Voici ce que ces outils savent faire, et surtout ce qu'ils ne savent toujours pas faire en mai 2026.
Mon protocole de test
J'ai construit un corpus de 50 textes :
- 20 textes humains certifiés (mes propres articles avant l'arrivée de GPT, des textes publiés par des journalistes connus, des extraits universitaires sourcés).
- 20 textes 100 % IA non retouchés (générés avec ChatGPT, Claude, Gemini sur des sujets variés).
- 10 textes "hybrides" (IA reformulée à la main pendant 10 minutes par un rédacteur).
Chaque texte a été soumis aux quatre outils, le même jour, avec les paramètres par défaut. J'ai noté le score, le verdict ("IA" ou "humain") et la confiance déclarée.
Comment fonctionnent ces détecteurs (en pratique)
Tous s'appuient sur deux mesures principales, dont la théorie est bien documentée par les équipes de recherche elles-mêmes.
La perplexité mesure à quel point chaque mot est "prévisible" dans son contexte. Les textes IA tendent à choisir des suites de mots statistiquement attendues. Un humain prend plus de risques lexicaux.
La burstiness mesure l'alternance entre phrases courtes et longues. Les humains varient davantage la longueur, les modèles IA produisent des structures plus homogènes.
Ces deux signaux combinés donnent un score. Le problème : ces signaux sont contournables et imparfaits, et les détecteurs eux-mêmes le reconnaissent dans leurs documentations.
Mes résultats sur les quatre outils
GPTZero : le plus connu. Sur mon corpus, il a correctement classé 17 textes IA sur 20, mais 5 textes humains sur 20 ont été signalés à tort comme "probablement IA". Les faux positifs concernaient surtout mes textes techniques écrits de façon structurée et factuelle. La version accessible est suffisante pour un test ponctuel, l'API permet d'automatiser.
Originality.ai : positionné sur le SEO, combine détection IA et plagiat. Sur mon corpus, il a été plus sévère : 19 IA sur 20 détectés, mais aussi 8 humains sur 20 mal classés. Très utile pour vérifier le plagiat en parallèle, mais le taux de faux positifs disqualifie son usage comme preuve.
Copyleaks : orienté entreprise et éducation, dashboard équipe. Performance proche de GPTZero sur mon corpus, avec une interface plus pensée pour des audits récurrents. conditions clairement supérieur.
Winston AI : visé pédagogique, interface enseignants. Sur mes textes universitaires authentiques (extraits de thèses publiées avant 2022), il a signalé 4 sur 10 comme "probablement IA". Inacceptable pour sanctionner un étudiant sur cette base.
Sur les textes hybrides (IA reformulée 10 minutes à la main), aucun des quatre outils n'a dépassé 60 % de détection correcte.
Ce que ça signifie pour les usages réels
Enseignants : un détecteur ne peut pas constituer une preuve disciplinaire. Les études publiées en 2023-2024 sur les biais des détecteurs envers les textes d'étudiants non-natifs anglais sont sans équivoque. La bonne approche reste l'évaluation pédagogique : oral, devoirs réalisés en présentiel, vérification de la compréhension réelle.
Éditeurs et responsables SEO : Google a confirmé en 2023 que c'est la qualité du contenu qui compte, pas la méthode de production. Un texte IA utile, original, vérifié et édité peut très bien se positionner. Un texte IA générique sera filtré comme n'importe quel contenu faible. Mon constat de terrain : les sites pénalisés en 2024-2025 par le Helpful Content Update n'avaient pas été pénalisés pour usage d'IA, mais pour absence d'apport.
Recruteurs : une lettre IA détectée révèle surtout un manque de personnalisation. C'est un signal faible sur la motivation, pas une preuve. L'entretien tranche.
Agences de contenu : la détection IA dans une livraison client est légitime, mais elle doit servir à demander une réécriture, pas à briser le contrat. Les détecteurs ont trop d'erreurs pour être normatifs.
Les contournements qui marchent
J'ai testé en parallèle les méthodes de contournement les plus citées :
- Reformulation manuelle ciblée des transitions et des conclusions : suffit à faire chuter le score IA sous 30 % chez tous les outils.
- Utilisation d'un outil de "humanisation" automatique (Undetectable.ai, StealthGPT) : efficace sur GPTZero et Copyleaks, moins sur Originality.
- Mélanger des phrases personnelles vraies avec une trame IA : indétectable à coup sûr.
La conclusion logique : tout texte IA correctement réécrit passe sous les radars. Tout texte IA brut sera repéré environ 80 % du temps.
Ma position honnête
Les détecteurs IA sont des indicateurs, jamais des preuves. Les utiliser comme preuve pour sanctionner ou refuser quelqu'un est juridiquement et éthiquement fragile, vu le taux d'erreur documenté. Je les recommande comme outil d'alerte interne dans une chaîne éditoriale, pas comme arbitre.
Pour évaluer la qualité d'un outil IA plutôt que d'un texte, mon retour sur le Trust Score et ma checklist RGPD couvrent les vraies questions à se poser avant d'adopter un outil dans une organisation.
Further reading
Compare AI tools
Compare tools by use case, category, and trust signals.
Trust Ranking
Review reliability, transparency, and product maturity signals.
IA SEO : optimiser le contenu
Structurer les contenus pour Google, les moteurs de réponse et les lecteurs.
Outils IA marketing contenu
Panorama éditorial pour rédaction, publication, analyse et automatisation marketing.
Official sources and method
Trust-Vault combines field usage with institutional sources to strengthen verification, compliance, and comparison clarity.
- Google Search Central - helpful content - Google. Official guidance on helpful, reliable, people-first content.
- Google Search Central - structured data - Google. Official documentation for structured data recognized by Google Search.
- The /llms.txt file - llmstxt.org. Public Markdown-format proposal to help AI systems understand a website.
- Artificial Intelligence - Federal Trade Commission. US authority resources on AI use, commercial claims, and consumer protection.
Laurent Duplat
Editor-in-Chief — Trust-Vault