¿ChatGPT plagia? Examinando las fuentes del Chatbot



Si bien ChatGPT puede responder cualquier pregunta que pueda tener, algunos usuarios se preguntan si sus respuestas contienen plagio. Para investigar esto, generamos cuatro tipos diferentes de textos usando ChatGPT y luego evaluamos su originalidad usando varias herramientas de detección de plagio.


¿Qué es exactamente el plagio y cómo funcionan los LLM?

Para determinar si ChatGPT es culpable de plagio, primero debes entender qué constituye plagio. El plagio implica el uso de palabras, ideas o trabajos de otra persona sin la atribución adecuada. Esto incluye copiar directamente texto de una fuente sin citarlo o parafrasear fielmente las ideas de otra persona sin reconocimiento.

ChatGPT, al igual que otros modelos de lenguajes grandes (LLM), se entrena en grandes conjuntos de datos, principalmente de contenido disponible públicamente. Sin embargo, recopilar cantidades tan grandes de datos plantea cuestiones éticas, ya que los creadores originales no han dado su consentimiento para que su trabajo se utilice en la formación de los LLM. Esto lleva a debates sobre la ética y la legalidad de tales prácticas.


Aunque ChatGPT genera respuestas basadas en las indicaciones que recibe, el problema radica en el contexto más amplio de cómo OpenAI (el desarrollador de ChatGPT) obtuvo los datos utilizados para entrenarlo, lo que implica el uso de contenido sin el consentimiento adecuado. Muchos ven esto como plagio y, para muchos sitios web, como robo de contenido. Sin embargo, es difícil identificar las fuentes exactas del plagio.

Durante el resto de este artículo, nos concentraremos en si ChatGPT plagia su producción de otras fuentes sin profundizar en los detalles de dónde provienen sus respuestas. Comprobemos la originalidad de las respuestas de ChatGPT utilizando varias herramientas de detección de plagio para ver si el chatbot utiliza texto de fuentes en línea directamente.

¿ChatGPT plagia ensayos?

En este primer ejemplo, le asignamos a ChatGPT la tarea de redactar un ensayo de 300 palabras sobre problemas de salud mental.


A continuación, utilizamos varias herramientas de detección de plagio para evaluar la originalidad del ensayo generado por el chatbot. Estas herramientas incluían el verificador de plagio Quetext, el verificador de plagio integrado de Microsoft Word, el verificador de plagio de Grammarly y el escáner de plagio Duplichecker.

El verificador de similitud incorporado de Microsoft informó cero por ciento de similitud con fuentes en línea. Los niveles de plagio detectados por otras herramientas también fueron mínimos: el detector de plagio de Grammarly encontró un cuatro por ciento, el detector de plagio de QueText encontró un cinco por ciento y el escáner de plagio de Duplichecker mostró un cero por ciento.

Teniendo en cuenta el pequeño porcentaje de plagio detectado, parece que ChatGPT no copia directamente ensayos de fuentes existentes.

¿ChatGPT plagia código?

Para evaluar si ChatGPT plagia código, le asignamos al chatbot la tarea de escribir código para una calculadora en Python.


Después de esto, llevamos a cabo una verificación de plagio en el código utilizando un verificador de plagio de programación especializado llamado Dolos, que detectó cero por ciento de similitud. Además, cuando verificamos el código utilizando las herramientas generales de detección de plagio de texto mencionadas anteriormente, los resultados fueron consistentes, y casi ninguno de los programas detectó más del cuatro por ciento de plagio.

Cuando le solicitamos a ChatGPT que generara un código para una calculadora de diferentes cuentas, las respuestas aparecieron diferentes. Esta observación y los resultados de las comprobaciones de plagio indican que ChatGPT no se limita a replicar códigos de fuentes en línea. En cambio, se basa en el conjunto de datos en el que fue entrenado para generar código de forma independiente.

¿ChatGPT plagia soluciones matemáticas?

Durante la tercera prueba, le asignamos al chatbot la tarea de resolver un problema matemático y proporcionar un razonamiento detallado para cada paso.


Para verificar la originalidad de la respuesta, probamos su resultado utilizando varias herramientas de detección de plagio específicas académicas, incluido el verificador de plagio PapersOwl, el escáner de plagio Trinka con tecnología de inteligencia artificial, así como herramientas generales de verificación de plagio como Grammarly, Duplichecker y QueText.

El detector de plagio de PapersOwl indicó una similitud de casi el 46 por ciento entre el razonamiento generado por el chatbot y las fuentes en línea. De manera similar, el detector de plagio Trinka informó más del 10 por ciento de similitud. Además, el detector de plagio de Grammarly detectó un 14 por ciento de similitud, QueText encontró un 17 por ciento y Duplichecker mostró un siete por ciento.


La detección de un alto nivel de plagio en la respuesta generada no sugiere que el chatbot copie directamente el razonamiento de las preguntas matemáticas de fuentes en línea. Esto se debe principalmente a que las soluciones y el razonamiento de los problemas matemáticos suelen ser estándar y están ampliamente disponibles en línea.

Entonces, aunque ChatGPT presenta sus propias respuestas, es posible encontrar las mismas respuestas y razonamientos en línea, lo que podría haber aumentado los altos porcentajes de plagio.

¿ChatGPT utiliza contenido de blogs?

Para comprobar si ChatGPT utiliza contenido de blogs en línea, le pedimos al chatbot que brindara consejos para mantener la salud de la batería de la computadora portátil.

Microsoft Word detectó un 10 por ciento de plagio en el texto generado. Duplichecker mostró un cuatro por ciento, el verificador de plagio de Grammarly indicó un 14 por ciento, pero Quetext encontró un 58 por ciento de plagio en el texto. Al investigar más, parte del texto de la respuesta del chatbot coincidía con el contenido de algunos blogs.


Para verificar si la alta detección de plagio no fue solo una coincidencia, le hice al chatbot algunas preguntas más sobre información que está fácilmente disponible en línea. El porcentaje de plagio en las respuestas generadas fue mucho mayor. Según nuestras pruebas, parece que el chatbot a veces utiliza frases y textos de fuentes en línea, lo cual es bastante sorprendente.

¿Debería utilizar ChatGPT para el trabajo o la escuela?

Aunque muchos verificadores de plagio en línea gratuitos no han detectado plagio importante en las respuestas de ChatGPT, no debes usarlo con fines académicos o profesionales.

No uses ChatGPT para tus tareas escolares si eres estudiante. Los instructores pueden utilizar herramientas como GPTZero y el detector de escritura de IA de Turnitin para detectar contenido generado por IA. Si su trabajo es marcado como generado por IA mediante dichas herramientas, podría reprobar la tarea o incluso ser expulsado de la escuela. Aunque muchas herramientas de detección de GPT establecen específicamente que no deben usarse para este propósito, lo son y podrían ocasionarle problemas. Sin mencionar que en realidad sólo te estás engañando a ti mismo al no estudiar el tema adecuadamente.


¿Puedes utilizar el chatbot para mejorar tu desempeño laboral? Eso depende. Si desea mejorar su flujo de escritura en correos electrónicos u otros formularios de texto, el uso de IA puede ahorrarle tiempo y esfuerzo. Sin embargo, sólo debe utilizarlo como una herramienta que le ayude en sus tareas en lugar de depender de él para que haga todo el trabajo por usted.

Por el contrario, si su trabajo, como el de redacción profesional, prohíbe el uso de dichas herramientas, debe evitar el uso de ChatGPT o cualquier otra herramienta por completo.

Esperamos que nuestras pruebas le hayan dado una idea de hasta qué punto ChatGPT puede aprovechar los recursos disponibles en la web. Sin embargo, es importante tener en cuenta que utilizamos herramientas de plagio gratuitas y probamos solo un conjunto de datos limitado. Entonces, si bien nuestros hallazgos pueden ser útiles, no deben tomarse como hechos absolutos.