Détecteur Chat GPT : Identifiez le contenu généré par ChatGPT (ou GPT3)
Depuis l’arrivée fracassante de ChatGPT dans la vie de monsieur et madame tout le monde, il est maintenant nécessaire de pouvoir détecter ChatGPT, les mœurs ont changé, l’outil est utilisé pour le meilleur comme pour le pire, la triche ou autre abus est devenu monnaie courante et pouvoir déterminer l’utilisation de l’IA également.
Detecter Chat GPT : les meilleurs outils
Le tableau des meilleurs détecteurs ChatGPT (du meilleur à gauche, au moins bon à droite) :
Lucide.ai | Winston | Compilatio | Detector DNG | Originality | GPTZero |
---|---|---|---|---|---|
Payant | Payant | Gratuit (pour un petit echantillon de texte) | Gratuit (pour un petit echantillon de texte) | Payant | Gratuit (pour un petit echantillon de texte) |
Très précis ! | Précis. | Relativement précis | Relativement précis | Précis | Relativement précis |
Le meilleur détecteur ChatGPT Francophone ! | Supporte le Français. | Supporte le Francais | Nescessite une traduction du contenu en Anglais avant la détection | Supporte (soi-disant) le Français. | Nescessite une traduction du contenu en Anglais avant la détection |
Vous trouverez dans le tableau ci-dessus les 5 acteurs majeurs du marché de la detection d'IA, ironiquement, le "text classifier" de la société OpenAI a fermé ces portes tant les résultats indiqués était peu fiables. Cependant si vous cherchez un détecteur d'IA fiable pour la Francophonie, Lucide.ai est excellent, Francais et spécialisé pour le marché Francophone.
Quel est LE meilleur détecteur de contenu IA en Francophonie ?
On s'est longtemps posé la question chez Impact IM pour savoir quel était le détécteur d'IA le plus fiable du marché afin de savoir quel contenu sort tout droit de ChatGPT. Nous en avons testé énormément pour vous mais aussi pour nous ! Dans notre métier de professionel du web, il fallait connaître la source de nos contenus publiés sur nos sites.
Et il se trouve qu'aucun ne nous satisfaisait vraiment. C'est pourquoi, avec mon experience dans le domaine de l'intelligence artificielle j'ai décidé d'allier mes forces avec Florent pour construire notre propre détecteur d'IA : Lucide.ai.
Aujourd'hui je le dit haut et fort, il est le plus fiable pour du contenu Francophone, il permet d'analyser n'importe quel texte, de lui attribuer un score et d'interpreter ce score tout en vous indiquant si le texte en question contient de l'IA. Quelques exemples.
Voici l'interface de l'outil :
Un scan de contenu humain sur Lucide :
2 scans de contenus IA sur Lucide.ai (à gauche un prompt assez complexe, à droite un prompt basique sur ChatGPT).
Si vous avez des questions concernant notre outil de détection, n'hésitez pas à passer par le formulaire de contact !
Les cas de triches avec ChatGPT
Une intelligence artificielle capable de répondre de manière précise et (presque) humaine a toutes les questions qu'on lui pose.
En soit, il s'agit pour beaucoup d'un raccourci colossal dans la vie de tous les jours, allant du programme sportif sur mesure, aux idées de repas, jusque dans le boulot, avec la possibilité d'accélérer considérablement sur beaucoup d'aspect redondant de son travail.
Les étudiants ne sont pas en reste, puisque Chat GPT est également l'eldorado des tricheurs (ou de ceux qui veulent accélérer grandement la rédaction d'une dissertation à faire à la maison par exemple).
En quelques jours seulement les médias s'en donnent à cœur joie, on entend ça de partout...
- Chat GPT, L'IA au service de la triche et de l'arnaque. Pour Paris Match.
- C'est quoi ChatGPT, l'outil qui fait craindre une triche massive à l'école ? pour BFMTV
- Chat GPT, 50% des étudiants de ce professeur ont trichés grâce à l'IA. Pour 01net.com
L'objectif de cet article est de faire la lumière sur un nouveau problème majeur : la possibilité de détecter un contenu qui a été rédigé par une intelligence artificielle. Et vous allez voir qu'il existe déjà des solutions fonctionnelles.
Qui a besoin de détecter du contenu IA ?
Avant toute chose, il est important de définir qui sont les gens qui ont besoins de détecter du contenu généré par intelligence artificielle aujourd'hui :
- Google : même si on ne sait pas encore ce que ce dernier va décider de faire concernant l'importante quantité de contenu généré au moins partiellement par intelligence artificielle, il est fort probable que Google soit déjà en mesure de détecter ce type de contenu.
- Les professionnels du web et éditeurs de sites : il est intéressant de savoir si un contenu publié sur l'un de nos sites est détecté comme un contenu IA ou non. Si c'est le cas, d'où vient-il ? Dans mon cas, si je paye un rédacteur Francophone pour un travail de recherche et de rédaction et qu'à aucun moment, il est spécifié que ce dernier sera assisté par une IA, je considère que c'est très problématique si le contenu que je reçois est un contenu "IA".
- Les médias et les réseaux sociaux qui veulent vérifier l'authenticité des contenus avant de les publier, pour prévenir la désinformation et la manipulation de l'opinion.
- Le corps éducatif, afin de vérifier l'authenticité des travaux qui leur sont rendus.
Un peu plus d'infos sur les outils de detections existants
Comme nous avons pu le voir dans le tableau au début de l'article, il existe déjà quelques outils intéressant, capable de détecter du contenu généré avec GPT3, GPT 3.5 et GPT 4 et donc ChatGPT.
OpenAI, l'entreprise leader du marché de l'IA et créatrice de ChatGPT lui-même, a mis en place son détecteur d'IA gratuit : https://platform.openai.com/ai-text-classifier, le comble c'est que d'après mes nombreux tests, ce dernier se trompe dans de nombreux cas et est moins capable de détecter l'IA de manière fiable que l'outil qui suit.
J'utilise principalement Originality.ai qui est celui qui a le plus fait ses preuves au sein de la communauté SEO Internationale (les référenceurs web étant sans doute les premiers utilisateurs de détecteurs IA). Et qui donc est le plus efficace pour le moment selon moi.
Début avril, Originality.ai a fait évoluer son algorithme de détection de contenu IA avec une version 1.4 de ce dernier. Elle surclasse officiellement tout les détecteurs actuels du marché. Le bémol ? l'outil est payant !
Mise à jour 07/02/2023 : Après être tombé sur cet article, une entreprise nommée Compilatio m'a contacté pour me montrer leur propre outil, accessible à tous et gratuitement... Prenant en charge le contenu français ! J'ai essayé, ça fonctionne bien d'après mes tests. Le contenu IA est détecté et le contenu humain aussi... Attention cependant aux faux positifs !
Voici un lien vers leur outil : https://ai-detector.compilatio.net/
Seul bémol de l'outil de Compilatio : On est limité à 2000 caractères... Difficile donc d'analyser de longs contenus !
Mention spéciale à l'outil : https://detector.dng.ai/ qui est développé par un Français, qui est gratuit et qui devrait bientôt pouvoir supporter la langue française dans la détection.
Pour finir, je vous donne également le dernier de ma liste, un outil développé par un étudiant pour lutter contre la triche (bonjour le fayot), il est moins stable que les deux premiers, mais il a le mérite d'exister : https://etedward-gptzero-main-zqgfwb.streamlit.app/. L'outil a pris une tout autre dimension récemment en devenant GPTZero.
Comment fonctionnent les détecteurs de contenus IA ?
Les méthodes de détection de contenu généré par l'IA sont nombreuses, et je ne suis honnêtement pas le mieux placé pour vous parler des aspects techniques.
Cependant, on peut citer l'analyse de style, les réseaux de neurones, la reconnaissance de motifs...
Dans le cas de l'analyse de style par exemple, des outils statistiques sont utilisés pour identifier tout ce qui va composer les caractéristiques stylistiques du contenu. (la longueur des phrases, la fréquence des mots, la structure syntaxique, etc.) Généralement, un contenu qui a été rédigé entièrement grâce à une intelligence artificielle sera donc bien différent en termes de style, et pourra être identifié.
Les réseaux de neurones quant à eux sont des algorithmes d'apprentissage qui peuvent être utilisé pour détecter le modèle d'un contenu humain (s'il en trouve un) VS le modèle d'un contenu IA.
La majeure partie des outils présents au-dessus utilisent également la sémantique et plus particulièrement des probabilités qu'un mot arrive après un autre. Le modèle d'IA GPT3 fonctionne de cette manière, il positionne des mots les uns après les autres en s'assurant de leur donner du sens bien entendu. L'objectif des outils de détection est ainsi d'identifier quel mot vient généralement après X ou Y mot. Et ça marche encore très bien !
Les particularités de ce type d'outil
L'arrivée de GPT 3 a bouleversé beaucoup de choses et le besoin de détecter des contenus générés par IA s'est vite fait connaître. Seulement il est important de saisir toutes les particularités liées a un outil comme Originality.ai et de comprendre que ce type d'outil n'est pas encore complètement fiable même si reconnu et utilisé par de nombreux référenceurs reconnus à l'international.
Détection en %
Originality AI fonctionne avec une détection du contenu IA en %. Si vous prenez du contenu directement généré par Chat GPT et que vous l'analyser dans l'outil, il y a de forte chance qu'il détecte très largement la présence de contenu IA (+90%).
Dans le cas d'un contenu rédigé par un humain, il est probable qu'il détecte quand même une petite partie de % "AI". Il faudra donc toujours faire attention à votre lecture des résultats.
Je considère qu'un contenu est TRÈS probablement un contenu IA si le % est au-delà de 80%.
Ci-dessous l'exemple d'un contenu rédigé à la main par mes soins.
L'outil considère donc que 21% "aurait pu être écrit par une IA", mais il considère aussi qu'une grosse majorité du contenu est "original".
Traduction en anglais nécessaire
La petite particularité de l'utilisation d'un outil comme Originality.ai pour moment, c'est qu'il faut traduire le contenu que l'on souhaite traduire.
Pour faire cela, je vous invite à utiliser Deepl, qui est le meilleur traducteur en ligne pour moi.
Sur YouTube, vous êtes nombreux à émettre des doutes et à penser que la traduction peut potentiellement biaiser le processus de détection.
Je pense que la traduction n'est pas un problème, puisque les outils d'analyse sont principalement basé sur la sémantique et donc sur la fameuse méthode du "mot qui viendra après ce mot".
La traduction d'un mot qui a été écrit par une IA restera fidèle a ce qu'a écrit l'IA et vice versa pour un contenu original.
L'arrivée imminente d'un filigrane "Open AI" ?
Open AI, l'entreprise qui développe Chat GPT et GPT3, est actuellement en train de travailler sur GPT4 qui devrait sortir ce trimestre et qui sera immensément plus puissant que GPT3...
Cependant, l'entreprise a également annoncé qu'ils travaillent sur un filigrane qui permettra d'identifier sans aucun doute un contenu qui a été généré par une intelligence artificielle qui fonctionne avec leur modèle GPT.
Il s'agit d'une nouvelle importante qui risque de calmer les abus d'utilisation de leurs outils.
FAQ (YouTube)
Comment formez-vous vos rédacteurs pour les assister avec l'IA?
Pour former mes rédacteurs à la rédaction par IA, j'utilise différents process. Le plus important pour moi, c'est qu'ils ne laissent jamais l'outil de génération de contenu IA prendre le dessus sur leur propre contenu, l'humain doit rester aux commandes et ne pas choisir l'option de la facilité en laissant l'IA travailler.
Google ne pénalise pas (encore) l'IA, mais je suis sûr que si vous souhaitez rester positionné sur le long terme, il faut vraiment axer le contenu vers la qualité et vers une réponse et un axe "EAT" + intention de recherche avant tout chose.
Est-ce que la longueur du contenu rend plus detectable l'utilisation d'IA pour la rédaction?
Non, les outils de détection sont capables de détecter l'IA, peu importe la longueur du contenu.
Si un étudiant s'inspire largement d'un article écrit par une IA pour l'un de ses devoirs, sera-t-il considéré comme du plagiat?
Si l'étudiant en question prend le temps d'enrichir la réflexion et d'en parler avec ses propres mots, non.
Est-ce que la traduction peut fausser les résultats de détection de contenu généré par une IA?
Non, je ne pense pas. Les outils de détection utilisent la sémantique et les mots. La traduction ne faussera pas radicalement ces données.
Est-il préférable de utiliser une IA pour générer un contenu de qualité pour les lecteurs plutôt que pour les gains de temps et de compréhension pour l'auteur?
Quand on parle d'IA et de rédaction de contenu, les intérêts sont nombreux. La qualité de l'information n'est pas toujours irréprochable quand on passe par une IA comme Chat GPT. Un humain devra donc toujours revérifier les informations. Chacun a ses propres raisons d'utiliser l'IA.
Me contacter