Que sait l’intelligence artificielle sur vous ? Bien plus que vous ne le pensez.

Vous savez probablement que les entreprises et les gouvernements collectent des données sur vous, comme votre nom et votre lieu de résidence. Mais votre profil numérique ne repose pas uniquement sur les données que vous choisissez de partager, toutes sortes de données supplémentaires vous concernant sont générées par des algorithmes d’apprentissage automatique. Ces algorithmes analysent des éléments tels que le moment de la journée où vous êtes en ligne, votre tendance à faire des fautes de frappe et le type de choses que vous recherchez.

Ces algorithmes utilisent ces données pour prendre des décisions à votre sujet et pour vous, et ils le font tous les jours, souvent à notre insu. Cela se passe généralement « derrière l’écran », sans nous déranger, de manière fluide et efficace.

Les décisions algorithmiques peuvent avoir plus de poids que vous ne le pensez. Si les algorithmes font des choses inoffensives ou utiles, comme modifier les feux de circulation lorsque vous approchez d’une intersection, ils décident également du contenu à afficher dans votre fil sur les réseaux sociaux. Il existe également des algorithmes qui aident des personnes réelles à décider si vous pouvez obtenir un prêt hypothécaire, entrer dans une université particulière ou bénéficier d’une assurance.

Mais comment obtiennent-ils des informations sur vous pour prendre ces décisions en premier lieu ?

Tout est basé sur vos données – et ce que l’on appelle votre profil numérique. Vous en saurez plus en regardant la vidéo ci-dessous, dans laquelle Katarzyna Szymielewicz, avocate spécialisée dans les droits de l’homme et les droits technologiques, préside notre organisation partenaire, la Fondation Panoptykon, ou en lisant la suite.

Les trois couches de votre profil numérique

Première couche

La première couche est celle que nous contrôlons nous-mêmes – ce sont les informations que nous donnons souvent volontairement lorsque nous utilisons un ordinateur, un téléphone ou tout autre appareil connecté à Internet : votre nom d’utilisateur, votre vrai nom, vos photos, vos amis, vos goûts, ce que vous recherchez, les personnes que vous avez bloquées dans vos contacts. Dans la plupart des cas, vous pouvez choisir de ne pas partager ce type de données en combinant l’option de refus, en évitant les plateformes gourmandes en données et en supprimant l’historique de vos activités, mais cela demande une attention constante et une maîtrise de soi. C’est une tâche plutôt difficile si vous souhaitez simplement vivre une partie de votre vie en ligne avec un certain degré de spontanéité.

La mauvaise nouvelle, c’est que même si vous parvenez à contrôler cette première couche de votre profil, il y en a deux autres qui se construisent à votre insu. Par le simple fait d’être en ligne et de faire des choses en ligne, vous partagez beaucoup plus que vous ne le pensez.

Deuxième couche

La deuxième couche de votre profil numérique comprend les traces de ce que vous faites en ligne - les données recueillies sur vos données ou « métadonnées ». Il peut s’agir des sites que vous visitez, de votre emplacement actuel et même de la vitesse à laquelle vous tapez (et du nombre de fautes que vous faites !).

Elle comprend également des traces de toute activité « connexe ». Par exemple, si vous avez un réfrigérateur intelligent, l’algorithme sait que vous avez laissé la porte ouverte pendant 3 minutes à 2 heures du matin pour prendre un encas. Et il n’oubliera pas.

Il est pratiquement impossible d’empêcher la collecte de ce type de données sur vous ou de refuser cette observation comportementale constante.

Troisième couche

Qu’est-ce que les algorithmes pourraient apprendre de plus sur nous après avoir déjà observé tous nos mouvements en ligne ?

Ils peuvent en apprendre davantage en comparant les données qu’ils ont recueillies à votre sujet aux niveaux 1 et 2 avec les données qu’ils ont recueillies auprès d’autres personnes, et en établissant des modèles avec ces informations. Les machines font des hypothèses et des prédictions sur vous en se basant sur des statistiques. Ils utilisent toutes les « connaissances » antérieures recueillies à votre sujet, ainsi que les observations faites sur vos ami·e·s ou sur des personnes qui vous ressemblent, pour prédire des choses comme votre origine ethnique, pour qui vous pourriez voter, si vous attendez un bébé, si vous aimez jouer, et même si vous souffrez d’une maladie mentale.

C’est cette troisième couche de votre profil numérique - appelée « données inférées » - qui est la plus précieuse pour les entreprises utilisant des IA. Sur la base de ces hypothèses, ils décident, par exemple, quelles publicités ils doivent vous montrer et si vous devez obtenir un prêt.

Et il est pratiquement impossible pour vous de contrôler ou même de découvrir ce que ces machines pensent de vous.

La bonne nouvelle ?

Des personnes commencent à s’attaquer à cette problèmatique pour que vous puissiez reprendre le contrôle de vos informations. Nos partenaires de Panoptykon veillent à ce que des garanties juridiques soient mises en place pour nous protéger et à ce que les plaintes déposées contre des entreprises avides de données se soldent par de lourdes amendes. Chez Mozilla, nous repensons la manière dont vos données sont collectées et utilisées dans le Data Futures Lab, un espace expérimental destiné à mettre en place de nouvelles approches de la gestion des données qui offrent plus de contrôle et d’autonomie aux personnes. La route est longue, mais nous allons dans la bonne direction.