ChatGPT plagie-t-il ? Examen des sources du Chatbot

Liens rapides

  • Qu’est-ce que le plagiat et comment fonctionne le LLM ?
  • ChatGPT plagie-t-il les essais ?
  • Est-ce que ChatGPT plagie du code ?
  • Est-ce que ChatGPT plagie des solutions mathématiques ?
  • Est-ce que ChatGPT utilise du contenu de blogs ?
  • Devriez-vous utiliser ChatGPT pour le travail ou l’école ?

Principaux points à retenir

  • Le plagiat détecté dans un essai et un code de programmation généré par ChatGPT était relativement faible, ce qui indique qu’il ne copie généralement pas ce type de contenu à partir de sources en ligne.
  • Le taux de plagiat était un peu plus élevé lors du calcul d’une solution mathématique. Cela peut s’expliquer par le fait que le raisonnement mathématique est généralement similaire d’une source à l’autre, de sorte que les réponses peuvent correspondre à d’autres documents.
  • Les réponses de ChatGPT aux questions sur les informations disponibles publiquement sur les blogs ont montré des pourcentages de plagiat plus élevés.

Bien que ChatGPT puisse répondre à n’importe quelle question, certains utilisateurs se demandent si ses réponses contiennent du plagiat. Pour répondre à cette question, nous avons généré quatre types de textes différents à l’aide de ChatGPT, puis nous avons évalué leur originalité à l’aide de divers outils de détection du plagiat.

Qu’est-ce que le plagiat et comment fonctionne le LLM ?

Pour déterminer si ChatGPT est coupable de plagiat, vous devez d’abord comprendre ce qu’est le plagiat. Le plagiat consiste à utiliser les mots, les idées ou le travail d’une autre personne sans lui en attribuer la paternité. Cela inclut la copie directe du texte d’une source sans citation ou la paraphrase des idées de quelqu’un d’autre sans reconnaissance.

ChatGPT, comme d’autres grands modèles de langage (LLM), est entraîné sur de vastes ensembles de données, provenant pour la plupart de contenus accessibles au public. Cependant, la collecte d’une telle quantité de données soulève des questions éthiques, car les créateurs originaux n’ont pas consenti à ce que leur travail soit utilisé pour former les LLM. Cela conduit à des débats sur l’éthique et la légalité de telles pratiques.

Bien que ChatGPT génère des réponses basées sur les messages qu’il reçoit, le problème réside dans le contexte plus large de la manière dont OpenAI (le développeur de ChatGPT) a obtenu les données utilisées pour l’entraîner, ce qui implique l’utilisation de contenu sans consentement approprié. Beaucoup considèrent qu’il s’agit de plagiat et, pour de nombreux sites web, de vol de contenu. Toutefois, il est difficile de déterminer avec précision les sources du plagiat.

Pour le reste de cet article, nous nous concentrerons sur la question de savoir si ChatGPT plagie ses résultats à partir d’autres sources, sans entrer dans les détails de l’origine de ses réponses. Vérifions l’originalité des réponses de ChatGPT à l’aide de divers outils de détection du plagiat pour voir si le chatbot utilise directement du texte provenant de sources en ligne.

ChatGPT plagie-t-il des essais ?

Dans ce premier exemple, nous avons demandé à ChatGPT de composer un essai de 300 mots sur les problèmes de santé mentale.

Voir aussi :  6 indicateurs de volume de trading que vous devez connaître

Ensuite, nous avons utilisé divers outils de détection du plagiat pour évaluer l’originalité de l’essai généré par le chatbot. Ces outils comprenaient le vérificateur de plagiat Quetext, le vérificateur de plagiat intégré de Microsoft Word, le vérificateur de plagiat Grammarly et le scanner de plagiat Duplichecker.

Le vérificateur de similitudes intégré à Microsoft a signalé une similitude de zéro pour cent avec les sources en ligne. Les niveaux de plagiat détectés par d’autres outils étaient également minimes : Le détecteur de plagiat de Grammarly a trouvé quatre pour cent, celui de QueText cinq pour cent, et le scanner de plagiat de Duplichecker zéro pour cent.

Compte tenu du faible pourcentage de plagiat détecté, il semble que ChatGPT ne copie pas directement des essais à partir de sources existantes.

ChatGPT plagie-t-il du code ?

Pour déterminer si ChatGPT plagie du code, nous avons demandé au chatbot d’écrire le code d’une calculatrice en Python.

Ensuite, nous avons vérifié le plagiat du code à l’aide d’un vérificateur de plagiat spécialisé dans la programmation appelé Dolos qui a détecté un taux de similarité de zéro pour cent. De même, lorsque nous avons vérifié le code à l’aide des outils généraux de détection de plagiat de texte mentionnés ci-dessus, les résultats étaient cohérents, presque aucun des programmes ne détectant plus de quatre pour cent de plagiat.

Lorsque nous avons demandé à ChatGPT de générer un code pour une calculatrice à partir de différents comptes, les réponses sont apparues différentes. Cette observation et les résultats des contrôles de plagiat indiquent que ChatGPT ne se contente pas de reproduire des codes provenant de sources en ligne. Au contraire, il s’appuie sur l’ensemble de données sur lequel il a été formé pour générer un code de manière indépendante.

ChatGPT plagie-t-il les solutions mathématiques ?

Lors du troisième test, nous avons demandé au chatbot de résoudre un problème mathématique et de fournir un raisonnement détaillé pour chaque étape.

Pour vérifier l’originalité de la réponse, nous avons testé son résultat à l’aide de plusieurs outils de détection de plagiat spécifiques aux universités, notamment le vérificateur de plagiat PapersOwl, l’analyseur de plagiat Trinka alimenté par l’IA, ainsi que des outils généraux de vérification de plagiat tels que Grammarly, Duplichecker et QueText.

Le détecteur de plagiat de PapersOwl a indiqué une similitude de près de 46 % entre le raisonnement généré par le chatbot et les sources en ligne. De même, le détecteur de plagiat de Trinka a signalé plus de 10 % de similitude. En outre, le détecteur de plagiat de Grammarly a détecté 14 % de similitude, QueText 17 % et Duplichecker 7 %.

La détection d’un taux élevé de plagiat dans la réponse générée ne suggère pas que le chatbot copie directement le raisonnement des questions mathématiques à partir de sources en ligne. Cela s’explique principalement par le fait que les solutions et les raisonnements pour les problèmes mathématiques sont souvent standard et largement disponibles en ligne.

Voir aussi :  Qu'est-ce que Bossware ? Vous suit-il à la trace chez vous ?

Ainsi, même si ChatGPT génère ses propres réponses, il est possible de trouver les mêmes réponses et raisonnements en ligne, ce qui peut expliquer les pourcentages élevés de plagiat.

ChatGPT utilise-t-il du contenu provenant de blogs ?

Pour vérifier si ChatGPT utilise du contenu provenant de blogs en ligne, nous avons demandé au chatbot de fournir des conseils pour préserver la santé de la batterie d’un ordinateur portable.

Microsoft Word a détecté 10 % de plagiat dans le texte généré. Duplichecker a indiqué 4 %, le vérificateur de plagiat de Grammarly a indiqué 14 %, mais Quetext a trouvé 58 % de plagiat dans le texte. En creusant un peu plus, on s’aperçoit qu’une partie du texte de la réponse du chatbot correspond au contenu de certains blogs.

Pour vérifier si le taux élevé de détection de plagiat n’était pas une simple coïncidence, j’ai posé au chatbot quelques questions supplémentaires sur des informations facilement accessibles en ligne. Le pourcentage de plagiat dans les réponses générées était beaucoup plus élevé. D’après nos tests, il semble que le chatbot utilise parfois des phrases et du texte provenant de sources en ligne, ce qui est assez surprenant.

Devriez-vous utiliser ChatGPT pour le travail ou l’école ?

Bien que de nombreux vérificateurs de plagiat en ligne gratuits n’aient pas détecté de plagiat majeur dans les réponses de ChatGPT, vous ne devriez pas l’utiliser à des fins académiques ou professionnelles.

Si vous êtes étudiant, n’utilisez pas ChatGPT pour vos travaux scolaires. Les enseignants peuvent utiliser des outils tels que GPTZero et le détecteur d’écriture AI de Turnitin pour repérer les contenus générés par l’IA. Si ces outils signalent que votre travail a été généré par une IA, vous risquez d’échouer au devoir ou même d’être renvoyé de l’école. Même si de nombreux outils de détection des TPG indiquent expressément qu’ils ne doivent pas être utilisés à cette fin, ils le sont, et cela pourrait vous causer des ennuis. De plus, vous vous trompez vous-même en n’étudiant pas le sujet correctement.

Pouvez-vous utiliser le chatbot pour améliorer votre performance au travail ? Cela dépend. Si vous souhaitez améliorer votre flux d’écriture dans les courriels ou d’autres formes de texte, l’utilisation de l’IA peut vous faire gagner du temps et des efforts. Cependant, vous ne devez l’utiliser que comme un outil pour vous aider dans vos tâches plutôt que de compter sur elle pour faire tout le travail à votre place.

En revanche, si votre travail, comme la rédaction professionnelle, interdit l’utilisation de tels outils, vous devriez éviter d’utiliser ChatGPT ou tout autre outil.

Nous espérons que nos tests vous ont donné un aperçu de la mesure dans laquelle ChatGPT peut puiser dans les ressources disponibles sur le web. Cependant, il est important de noter que nous avons utilisé des outils de plagiat gratuits et que nous n’avons testé qu’un ensemble limité de données. Ainsi, bien que nos résultats puissent être utiles, ils ne doivent pas être considérés comme des faits absolus.

Voir aussi :  IA forte et IA faible : quelle est la différence ?

Améliorez votre QI technologique grâce à nos lettres d’information gratuites

En vous abonnant, vous acceptez notre politique de confidentialité et pouvez recevoir des communications occasionnelles ; vous pouvez vous désabonner à tout moment.

Articles recommandés

La technologie expliquée

J’ai utilisé Microsoft Copilot Personal Shopper pour acheter des cadeaux : Voici comment cela s’est passé

Vous pourriez être surpris par l’utilité de Microsoft Copilot pour choisir des cadeaux.

Achats en ligne

Pourquoi vous devriez envisager de supprimer votre compte Temu

Temu est peut-être bon marché, mais le jeu n’en vaut pas la chandelle.

Réseau Tor

5 façons d’accéder aux sites en oignon sans le navigateur Tor

Bien qu’il soit possible d’accéder à des sites en oignon sans utiliser le navigateur Tor, il est souvent préférable de s’en tenir au logiciel qui a fait ses preuves.

PDF

7 outils d’IA qui répondent aux questions posées par vos PDF

Si certains chatbots d’IA peuvent lire les PDF, qu’en est-il des outils capables de répondre directement aux questions qu’ils posent ? Voici nos meilleurs choix.

Jeux de mots

Connexions #338 : La réponse et les indices du jour (mardi 14 mai 2024)

Vous n’arrivez pas à résoudre le jeu Connections d’aujourd’hui ? Nous avons des indices pour chaque catégorie, ainsi que la solution si vous êtes bloqué.

Jeux de mots

Connexions #339 : La réponse et les indices du jour (mercredi 15 mai 2024)

Vous n’arrivez pas à résoudre le jeu Connections d’aujourd’hui ? Nous avons des indices pour chaque catégorie, ainsi que la solution si vous êtes bloqué.

ChatGPT plagie-t-il d’autres sources ?

Est-ce que ChatGPT plagie ? Non, ChatGPT ne fait pas de plagiat dans le sens où il ne copie pas d’informations et ne vous les transmet pas.

Les universités peuvent-elles détecter ChatGPT si vous paraphrasez ?

Oui, les universités peuvent détecter le contenu généré par Chat GPT. La plupart des universités utilisent des plateformes telles que Turnitin pour garantir l’intégrité des travaux des étudiants. Ces plateformes ont adapté leurs technologies pour reconnaître les contenus produits par des modèles d’IA avancés.

Les réponses générées par l’IA sont-elles plagiées ?

Contenu d’IA et plagiat Étant donné que les outils d’intelligence artificielle génèrent un contenu unique à partir de zéro au lieu de voler les idées de quelqu’un, l’utilisation d’un outil d’IA ne constitue pas techniquement un plagiat, contrairement au plagiat par copier-coller. Toutefois, cela ne vaut que si l’outil de création de contenu crée le contenu à partir de zéro à l’aide de l’apprentissage automatique.

Le GPT-4 est-il un plagiat ?

Les modèles d’IA de l’OpenAI, tels que GPT-3 et GPT-4, sont formés sur des ensembles de données massives et génèrent de nouveaux contenus sur la base de modèles appris à partir de ces données. Ils ne copient pas délibérément des travaux existants. Bien que le contenu généré par l’IA soit original, il peut ressembler étroitement aux données d’entraînement.

Cliquez pour évaluer cet article !
[Total: Moyenne : ]

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *