Fabricación de artículos de investigación generados por IA y plagio en la comunidad científica
ChatGPT puede fabricar datos médicos bastante convincentes, según un nuevo artículo publicado en Patterns.
Esto hará que sea más fácil que nunca publicar investigaciones fraudulentas, según los autores del artículo.
"Las razones para fabricar investigaciones utilizando una tecnología basada en IA incluyen ganancias financieras, fama potencial, promoción en la academia y creación de currículum vitae, especialmente para estudiantes de medicina que se encuentran en aguas cada vez más competitivas", escriben.
Los investigadores le pidieron a ChatGPT que generara un resumen para un artículo científico sobre los efectos de dos diferentes medicamentos en la artritis reumatoide, utilizando datos de 2012 a 2020.
El chatbot devolvió un resumen que sonaba convincente, dando números reales y, cuando los investigadores lo solicitaron, diciendo que un medicamento funcionaba mejor que otro.
ChatGPT solo toma datos hasta 2019, por lo que no podría tener cifras de 2020. También afirmó haber tomado estos números de una base de datos privada, a la que se requiere una tarifa para acceder.
"En una tarde, uno puede encontrarse con docenas de resúmenes que pueden enviarse para su publicación a varias conferencias", advierten los investigadores.
"Al aceptar un resumen para su publicación, uno puede usar esta misma tecnología para escribir su manuscrito, completamente basado en datos fabricados y resultados falsificados".
Los investigadores señalan que puede haber formas positivas para que los investigadores utilicen la IA.
"Utilizar una IA para la investigación no es un esfuerzo inherentemente malicioso. Pedirle a una IA que revise la gramática del trabajo o escriba una conclusión para los resultados legítimos encontrados en un estudio son otros usos que una IA puede incorporar en el proceso de investigación para eliminar el trabajo pesado que puede ralentizar el proceso de investigación científica", escriben.
Dicen que su propio trabajo fue revisado gramaticalmente por una IA.
"El problema surge cuando uno utiliza datos que no existen para fabricar resultados para escribir investigaciones, que fácilmente pueden pasar por alto la detección humana y llegar a una publicación. Estos trabajos publicados contaminan la investigación legítima y pueden afectar la generalización de los trabajos legítimos".
Dicen que la comunidad de investigación debería pensar en la mejor manera de incorporar salvaguardas contra esta amenaza.
Artículo científico: AI-generated research paper fabrication and plagiarism in the scientific community