Vos données Gmail ont-elles servi à former l'IA Bard ?

Bard lui-même affirme que vos courriels dans Gmail ont entraîné l'IA, ce que Google dément, affirmant que Bard a fait une erreur.

2023-03-30

Did Gmail data train the Google AI Bard?

La semaine dernière, un tweet est devenu viral, demandant si l'intelligence artificielle de Google, Bard, avait été entraînée à partir de données Gmail. La question a été soulignée par le fait que Bard lui-même a déclaré qu'il avait été formé sur "Google Search, Gmail et d'autres données".

S'INSCRIRE

Gmail a-t-il formé Bard ?

La semaine dernière, un tweet est devenu viral dans lequel Bard, l'intelligence artificielle de Google, affirmait avoir été entraînée à partir de données Gmail.

Umm, anyone a little concerned that Bard is saying its training dataset includes... Gmail?

I'm assuming that's flat out wrong, otherwise Google is crossing some serious legal boundaries. pic.twitter.com/0muhrFeZEA
— Kate Crawford (@katecrawford) March 21, 2023

Bard itself says it has been trained with Gmail emails

Google n'a pas tardé à répondre en expliquant que

"Bard est une expérience précoce basée sur de grands modèles de langage et fera des erreurs. Il n'a pas été formé sur les données de Gmail".

Google a fait une déclaration plus détaillée à The Register, un média spécialisé dans la technologie :

"Comme tous les LLM, Bard peut parfois générer des réponses contenant des informations inexactes ou trompeuses tout en les présentant de manière confiante et convaincante. Ceci en est un exemple. Nous n'utilisons pas les données personnelles de votre Gmail ou d'autres applications et services privés pour améliorer Bard."

Si vous craignez que vos courriels privés aient entraîné Bard, consultez l'alternative Gmail Tutanota.

Quelles sont les données utilisées pour entraîner Bard ?

Il n'est pas facile de savoir quelles données ont été utilisées pour entraîner Bard. Tant que Google ne publiera pas les ensembles de données utilisés, personne ne pourra savoir avec certitude qui a raison : Bard ou Google.

Blake Lemoine, un ancien employé de Google qui a été licencié pour avoir divulgué des secrets de Google et qui croit que le grand modèle de langage (LLM) LaMDA de Google était sensible, a répondu au tweet en disant:

"Le moteur LaMDA qui sous-tend Bard est également celui qui gère l'autocomplétion et l'autorépondeur dans Gmail, donc ... oui, les données d'entraînement de Bard incluent Gmail.
Pour info, ils ont fait beaucoup d'efforts pour s'assurer que LaMDA n'utilise pas d'informations personnelles sur les individus dans ses réponses."

Meredith Whittaker, présidente de Signal, oriente la conversation dans une direction totalement différente en déclarant: "L'IA est le produit d'une concentration d'intelligence artificielle :

"L'IA est un produit du pouvoir concentré, et nous détournons les yeux des réalités politiques et économiques à nos risques et périls.
En d'autres termes, le fait que le BARD soit entraîné sur Gmail ou non est moins scandaleux que le fait que seuls Google et quelques autres sociétés de surveillance puissent fabriquer un BARD."

Vos données sont le nouveau pétrole

Le dicton est vrai depuis des décennies : Vos données sont le nouveau pétrole.

L'essor des logiciels d'IA développés par les grandes entreprises technologiques le démontre une fois de plus : Microsoft, Google et Baidu ne peuvent développer leurs modèles d'IA ChatGPT, Bard et Ernie que parce qu'ils disposent d'une grande quantité de données qu'ils peuvent utiliser pour former ces chatbots d'IA.

Le problème, cependant, c'est que ces entreprises ne sont pas particulièrement connues pour protéger la vie privée des utilisateurs. C'est la raison pour laquelle de nombreuses personnes ont du mal à faire confiance à Gmail and Co et queChatGPT a récemmentété décrit comme un "cauchemar en matière de protection de la vie privée".

Vous payez avec vos données

One of the most popular free email services: Gmail.

Chaque fois que vous utilisez l'internet, en particulier lorsque vous utilisez un service "gratuit", vous payez avec vos données.

À l'heure du Big Data et de l'IA, vos données sont le nouveau pétrole. Vos données sont une vache à lait pour Google, Microsoft, Baidu et d'autres. Vous ne payez pas directement ces services, mais vous payez en recevant des publicités qui vous font acheter des choses dont vous n'avez pas nécessairement besoin ou que vous n'auriez pas achetées à ce prix sans le bombardement constant de publicités.

En outre, ces entreprises utilisent vos données pour créer des produits totalement nouveaux qui valent des millions, comme les robots de conversation. Meredith Whittaker, de Signal, a tout à fait raison : il n'est pas normal que seuls les capitalistes de surveillance des grandes entreprises technologiques disposent d'ensembles de données si vastes qu'ils peuvent créer un Bard ou un ChatGPT.

Les responsables politiques doivent suivre de près cette évolution et veiller à ce que ces grandes entreprises technologiques n'abusent pas de leur pouvoir monopolistique sur les données de tout un chacun.

Choisissez la protection de la vie privée

Si vous voulez changer les choses, vous pouvez cesser d'alimenter les monopoles de la surveillance sur l'internet en choisissant des services de protection de la vie privée lorsque vous utilisez le web.

Pour vous assurer que vos courriels privés ne peuvent pas être utilisés pour entraîner Bard - ou toute autre IA - vous pouvez créer une adresse électronique sécurisée avec Tutanota. Dans Tutanota, toutes vos données sont cryptées de bout en bout, ce qui garantit que vos courriels privés restent privés et que personne ne peut abuser de vos données.

S'INSCRIRE

Author

Black and white picture of Hanna being shocked a bit.

Hanna fait partie de l'équipe Tuta depuis le lancement du client de messagerie sécurisé Tutanota en 2014. Au fil des ans, elle est devenue experte dans l'explication de la cryptographie à l'internaute moyen, s'assurant que tout le monde comprenne pourquoi la vie privée est importante et comment le cryptage aide à protéger ses données sur le web.