¿Entrenaron tus datos de Gmail al bardo de la IA?

El propio Bard afirma que sus correos electrónicos en Gmail entrenaron a la IA, Google lo niega, diciendo que Bard cometió un error.

2023-03-30

Did Gmail data train the Google AI Bard?

La semana pasada se hizo viral un tuit en el que se preguntaba si la IA Bard de Google se había entrenado con datos de Gmail. La pregunta quedaba subrayada por el hecho de que la propia Bard afirmaba que había sido entrenada con "datos de Google Search, Gmail y otros".

REGÍSTRATE

¿Entrenó Gmail a Bard?

La semana pasada se hizo viral este tuit en el que la IA Bard de Google afirmaba haber sido entrenada con datos de Gmail.

Umm, anyone a little concerned that Bard is saying its training dataset includes... Gmail?

I'm assuming that's flat out wrong, otherwise Google is crossing some serious legal boundaries. pic.twitter.com/0muhrFeZEA
— Kate Crawford (@katecrawford) March 21, 2023

Bard itself says it has been trained with Gmail emails

La propia Google se apresuró a responder explicando que

"Bard es un experimento temprano basado en Large Language Models y cometerá errores. No está entrenado con datos de Gmail".

Google hizo una declaración más extensa a The Register, un medio de noticias sobre tecnología:

"Como todos los LLM, Bard a veces puede generar respuestas que contengan información inexacta o engañosa mientras la presenta de forma segura y convincente. Este es un ejemplo de ello. No utilizamos datos personales de tu Gmail u otras aplicaciones y servicios privados para mejorar Bard".

Si te preocupa que tus correos electrónicos privados entrenen a Bard, echa un vistazo a la alternativa de Gmail Tutanota.

¿Qué datos se utilizan para entrenar a Bard?

No es tan fácil averiguar qué datos se utilizaron realmente para entrenar a Bard. Mientras Google no publique qué conjuntos de datos se utilizan, nadie puede saber con seguridad quién tiene razón: Bard o Google.

Blake Lemoine, un antiguo empleado de Google que fue despedido por filtrar secretos de Google y que cree que LaMDA, el gran modelo de lenguaje (LLM) de Google, era sensible, respondió al tuit diciendo:

"El motor LaMDA subyacente en Bard es también lo que impulsa el autocompletado y la respuesta automática en Gmail, así que... sí, los datos de entrenamiento de Bard incluyen Gmail.
FWIW, ponen mucho esfuerzo en asegurar que LaMDA no utiliza dar información personal sobre los individuos en sus respuestas".

Meredith Whittaker, Presidenta de Signal, cambia la conversación en una dirección completamente diferente al decir:

"La IA es un producto del poder concentrado, y quitamos los ojos de las realidades económicas políticas por nuestra cuenta y riesgo.
Dicho de otro modo, que BARD se entrene o no en Gmail es menos escandaloso que el hecho de que sólo Google y algunos otros cos de vigilancia puedan hacer un BARD".

Tus datos son el nuevo petróleo

El dicho es cierto desde hace décadas: Tus datos son el nuevo petróleo.

El auge del software de inteligencia artificial desarrollado por grandes corporaciones tecnológicas lo demuestra una vez más: Microsoft, Google y Baidu sólo son capaces de desarrollar sus modelos de IA ChatGPT, Bard y Ernie porque tienen una gran cantidad de datos que pueden utilizar para entrenar a estos robots de chat de IA.

El problema, sin embargo, es que estas empresas no son especialmente conocidas por proteger la privacidad de los usuarios. Esta es también la razón por la que a mucha gente le cuesta confiar en Gmail y compañía y también por la queChatGPT ha sido desc rito recientementecomo una "pesadilla para la privacidad".

Pagas con tus datos

One of the most popular free email services: Gmail.

Siempre que utilizas Internet, sobre todo cuando usas un servicio "gratuito", estás pagando con tus datos.

En tiempos del Big Data y la IA, tus datos son el nuevo petróleo. Tus datos son una gallina de los huevos de oro para Google, Microsoft, Baidu y otros. Aunque no pagues directamente a estos servicios, pagas porque te muestran anuncios que te hacen comprar cosas que no necesitas necesariamente o que no habrías comprado a ese precio sin el bombardeo constante de anuncios.

Además, estas empresas utilizan tus datos para crear productos completamente nuevos que valen millones, como los bots de chat con inteligencia artificial. Y aquí, Meredith Whittaker, de Signal, tiene toda la razón: no está bien que solo los capitalistas de vigilancia de Big Tech tengan conjuntos de datos tan grandes que puedan hacer un Bard o un ChatGPT.

Los políticos deben vigilar de cerca esta evolución y asegurarse de que estas grandes empresas tecnológicas no puedan abusar de su poder monopolístico sobre los datos de todo el mundo.

Elige la privacidad

Si tú mismo quieres cambiar las cosas, puedes dejar de alimentar a los monopolistas de la vigilancia en Internet eligiendo servicios que den prioridad a la privacidad cuando utilices la red.

Para asegurarte de que tus correos electrónicos privados no pueden ser utilizados para entrenar a Bard -o a cualquier otra IA- puedes crear una dirección de correo electrónico segura con Tutanota. En Tutanota todos tus datos están encriptados de extremo a extremo, lo que garantiza que tus correos electrónicos privados sigan siendo privados y que nadie pueda abusar de tus datos.

REGÍSTRATE

Author

Black and white picture of Hanna being shocked a bit.

Hanna forma parte del equipo de Tuta desde el lanzamiento del cliente de correo electrónico seguro Tutanota en 2014. A lo largo de los años, se ha convertido en una experta en explicar la criptografía al usuario medio de Internet, asegurándose de que todo el mundo entienda por qué es importante la privacidad y cómo el cifrado ayuda a proteger los datos en la web.

Artículos más leídos