Cómo darse de baja del entrenamiento de IA de LinkedIn
Los modelos de IA generativa no surgen de la nada. En cierto sentido, estos sistemas se construyen pieza por pieza utilizando enormes cantidades de datos de entrenamiento y siempre necesitan más y más información para seguir mejorando.
A medida que se intensifica la carrera de la IA, las empresas están haciendo todo lo posible para alimentar sus modelos con más datos, y muchas están usando nuestros datos para hacerlo, a veces sin pedirnos primero nuestro permiso explícito.
LinkedIn es el último aparente perpetrador de esta práctica: parece que la plataforma de redes sociales orientada a la carrera "favorita" de todos ha estado usando nuestros datos para entrenar sus modelos de IA sin primero pedir permiso ni revelar la práctica. Joseph Cox de 404Media informó inicialmente la historia, pero no es necesario ser periodista para investigarla por uno mismo.
New from 404 Media: LinkedIn is training AI on users before updating its terms of service. People noticed a new setting on generative AI. I asked LinkedIn, they said they're updating their terms "shortly." They went ahead and trained AI w/o updating https://t.co/42D7WQb12X pic.twitter.com/ljJcPYsBEo
— Joseph Cox (@josephfcox) September 18, 2024
Solo tienes que ir a LinkedIn, hacer clic en tu perfil y acceder a Ajustes y privacidad → Privacidad de datos. Allí verás un campo interesante: Datos para la mejora de la IA generativa. Esta configuración pregunta: "¿Pueden LinkedIn y sus afiliados usar tus datos personales y el contenido que creas en LinkedIn para entrenar modelos de IA generativos que creen contenido?". ¿Qué es esto? ¿Está configurado en Activado de manera predeterminada? Gracias por preguntar, LinkedIn.
¿Para qué utiliza LinkedIn tus datos?
Si haces clic en el enlace Más información, verás una explicación de LinkedIn sobre lo que hace LinkedIn con tus datos. Cuando esta función está habilitada, los datos de tu perfil y el contenido de tus publicaciones se pueden utilizar para entrenar o "afinar" los modelos de inteligencia artificial generativa de LinkedIn y sus afiliados. ¿Quiénes son estos afiliados? Bueno, LinkedIn dice que algunos de sus modelos son proporcionados por Azure OpenAI de Microsoft, pero no brindan más detalles, hasta donde yo sé.
La compañía hace hincapié en esta explicación al decir que solo los modelos de IA entrenados para generar contenido, como su asistente de escritura impulsado por IA, usan tus datos, en lugar de los modelos de IA responsables de personalizar LinkedIn por usuario o los que se usan para seguridad.
También dice que su objetivo es "minimizar" los datos personales utilizados para los conjuntos de entrenamiento, incluso mediante el uso de "tecnologías de mejora de la privacidad" para ocultar o eliminar datos personales de estas bases de datos, pero no dice cómo lo hace ni en qué grado. Dicho esto, ofrecen un formulario para optar por no utilizar sus datos para "modelos GAI que no generen contenido".
Curiosamente, Adobe adoptó el enfoque opuesto cuando los usuarios se quejaron de su política de acceso al trabajo de los usuarios para entrenar modelos de IA: insistieron en que los datos de los usuarios no se usaban para modelos de IA generativos, sino para otros tipos de modelos de IA. De cualquier manera, estas empresas no parecen entender que las personas preferirían que sus datos se omitieran de todos los conjuntos de entrenamiento de IA, especialmente cuando ni siquiera se les preguntó sobre ellos en primer lugar.
LinkedIn dice que conserva tus datos mientras tú lo hagas: si borras tus datos de LinkedIn, ya sea eliminando una publicación o mediante la herramienta de acceso a datos de LinkedIn, la empresa los eliminará de su parte y, por lo tanto, dejará de usarlos para entrenar IA. La empresa también aclara que no utiliza datos de usuarios en la UE, el EEE o Suiza.
En mi opinión, esta práctica es ridícula. Creo que es inconcebible obligar a los usuarios a entrenar modelos de IA con sus datos sin presentarles la opción primero, incluso antes de actualizar los términos del servicio. No me importa que las débiles leyes de privacidad de datos permitan a empresas como LinkedIn almacenar todo lo que publicamos o cargamos en sus plataformas: si quieres usar la publicación de alguien para mejorar tu bot de escritura, pregúntale primero.
Me comuniqué con LinkedIn para preguntar específicamente sobre algunas de las inconsistencias en su política y para saber cuánto tiempo lleva en marcha este proceso. La empresa respondió a mis solicitudes con un enlace a una página que describe las actualizaciones de su acuerdo de usuario y política de privacidad, pero el primero parece no estar actualizado en este momento. LinkedIn dice que los supuestos cambios entrarán en vigor el 20 de noviembre, pero el acuerdo de usuario actual es de 2022. Además, los artículos de soporte a los que he hecho referencia en este artículo se actualizaron hace siete días al momento de escribir este artículo.
Cómo darse de baja del entrenamiento de IA de LinkedIn
Para seguir usando LinkedIn sin entregar tus datos para entrenar sus modelos de IA, regresa a Ajustes y privacidad → Privacidad de datos → Datos para la mejora de la IA generativa. Aquí, puedes hacer clic en el botón a Off para desactivar esta opción. También puedes utilizar este formulario para “oponerte o solicitar la restricción” del procesamiento de tus datos para “modelos GAI que no generen contenido”.
Esto no es retroactivo: cualquier capacitación que ya se haya realizado no se puede deshacer, por lo que LinkedIn no eliminará los efectos del entrenamiento de tus datos de sus modelos.
Cuando optas por no participar, tus datos aún pueden usarse para procesar IA, pero solo cuando interactúas con los modelos de IA: LinkedIn dice que puede usar tus entradas para procesar su solicitud e incluir cualquiera de los datos de esa entrada en la salida de la IA, pero así es como funcionan los modelos de IA. Si LinkedIn no pudiera acceder a estos datos después de que optaras por no participar, el modelo sería en gran medida inútil.