Pas de panique, nous collectons vos données

Paysage des médias numériques 2019

Dans le premier épisode de cette série d’articles consacrée aux données personnelles et à leurs enjeux, je proposais une courte définition de la donnée personnelle et commençait à dessiner un portrait des acteurs qui collectent lesdites données. Dans cet article, nous vous les présenterons plus en détail. Bienvenue dans le fabuleux monde du Big Data.

Les classiques : les grandes entreprises du numérique

Que l’on parle des GAFAM (Google, Amazon, Facebook, Apple et Microsoft) ou des BATX (Baidu, Alibaba, Tencent et Xiaomi, leurs équivalents chinois), ce sont toutes des entreprises dont tout ou partie de leur modèle économique repose sur la collecte, l’utilisation ou la revente de données personnelles. Ainsi, si Google est majoritairement connu du grand public pour son moteur de recherche, c’est son activité publicitaire qui représentait près de 60% de son chiffre d’affaires de 136 milliards de dollars en 2018, selon Statista. La force de ce géant de la publicité que représente Google AdSense ? L’énorme collecte de données opérée à travers les nombreux services de Google. Google Agenda, Gmail, Google Drive, YouTube, Google Suite, Google Maps… sont autant de services gratuits d’utilisation (et souvent très pratiques) qui ne représentent qu’autant de moyens de collecte pour Google et sa maison-mère, Alphabet. Il ne reste alors à Google qu’à afficher la pub la plus susceptible de vous intéresser selon votre historique d’actions sur ses services pour perpétuer son modèle commercial. La firme de la Silicon Valley a donc le moyen de connaître une bonne partie des habitudes de ses clients, et donc de leur vie. C’est d’ailleurs sur cette proximité avec l’utilisateur que Baidu, le moteur de recherche quasi monopolistique chinois, communique principalement. Son slogan ? « Baidu connaît mieux les Chinois ». Éloquent et polysémique.  

Paysage des médias numériques 2019

La plupart de ces entreprises ont un pied bien ancré dans notre quotidien, fournissant le matériel et les logiciels que nous utilisons tous les jours : ordinateurs ou smartphones ainsi que leurs systèmes d’exploitation respectifs, réseaux sociaux, place d’achat, capteurs en tout genre (domotique ou santé) et même pour de plus en plus d’acteurs, enceintes connectées. De quoi amasser une base de données effrayante par son exhaustivité.

On y pense moins : les enseignes que l’on fréquente

On les collectionne dans nos portefeuilles, elles nous apportent des réductions et autres avantages plus ou moins généreux selon les commerçants : ce sont les cartes de fidélités ! Apparaissant pour la première fois en France à la FNAC en 1954, elles ont depuis conquis une grande partie des enseignes. Elles prennent de nombreuses formes, de la plus modeste alliant carton et tampon à la carte de crédit utilisable uniquement dans le magasin en passant par la fameuse cagnotte, si chère à la grande distribution. C’est sur cette dernière que nous allons nous pencher.

Pour une enseigne de grande distribution, une fois le client dans le magasin, le but est de faire en sorte qu’il y revienne. Comment procéder ? Comme pour les géants du numérique tout est une histoire de connaissance de la clientèle. Avec une carte de fidélité, Carrefour, E.Leclerc, Auchan et consorts peuvent, à moindre coût, connaître la régularité d’un client donné, son panier moyen, son mode de vie ainsi que sa situation intime. L’achat d’un bouquet de roses et d’une bouteille de vin est, en effet, au moins aussi révélateur d’une situation particulière que de profiter de gros volumes pour se constituer un stock de couches pour bébés ultra-absorbantes. Grâce à ces données récoltées avec la bonne volonté du consommateur, l’enseigne saura certainement quels produits mettre en avant lors de promotions ou d’envois de mails. Optimisation et personnalisation sont les maîtres mots, aux dépens de la vie privée due à tout à chacun.

À ce propos, Forbes (en anglais) relate une histoire révélatrice de la précision statistique des données collectées. Target, la chaîne de grande distribution américaine, envoie des coupons de réduction pour des produits pour bébé, comme des couches ou des lotions, à une jeune femme encore au lycée. Son père, furieux de cet « encouragement » à avoir un enfant, va voir le responsable du Target le plus proche afin de lui transmettre le fond de sa pensée. Excuses du manager, confus. Ce dernier passe, un peu plus tard, un appel au père afin de faire amende honorable. C’est au tour du père de demander pardon au chef d’équipe pour son emportement. Après une discussion avec sa fille, celui-ci découvrit qu’elle était bel et bien enceinte. En se basant sur les récentes tendances d’achat de la jeune fille, et en les comparant aux tendances moyennes de femmes attendant un enfant Target a su avant le futur grand-père que cette jeune fille était enceinte… et a peut-être un peu précipité l’annonce de la nouvelle.

On ne les connaît pas : les data brokers

En langue française, on les appellera courtiers en données, mais le travail reste le même : amasser de la donnée brute, l’agrégée, lui donner un sens puis revendre. Ils s’appellent Axciom, Equifax, Experian ou Cambridge Analytica. Ces entreprises achètent les données récoltées par les acteurs que nous avons évoquées plus haut (et d’autres, bien évidemment) et croisent ces données avant de les vendre à d’autres, comme solutions marketing. La collecte de données touche ici son point culminant. Là où un acteur classique collectera et aura un accès direct aux données de ses utilisateurs sur un sujet précis qui l’intéresse, les data brokers ont accès à tout ce qui se vend.

800 millions d’individus sont répertoriés par Equifax, qui calcule les risques financiers

800 millions d’individus répertoriés. 3 milliards de dollars de chiffre d’affaires annuel. C’est l’exemple d’Equifax, société ayant pour fonds de commerce la collecte de données à des fins de notation et de calcul de la prise de risques lors de prêts financiers. C’est ainsi que par les données qu’elle accumule grâce à différents moyens, elle peut, à travers des notes, renseigner sur la solvabilité d’un citoyen réduit au rang de statistiques, d’habitudes et de consommateur. C’est d’ailleurs face à cette agrégation de données que l’Union des Consommateurs du Québec demande de prendre garde : l’importance de ces statistiques automatisées est grandissante, et « six mois de chômage peuvent effacer 25 ans de conduite exemplaire » lors d’une demande d’assurance auto. Ces données qui même lorsqu’elles sont réelles influent (trop) fortement la vie des répertoriés, se révèlent, en plus de cela, souvent inexactes. Le même organisme recommande de vérifier une fois par an si des informations n’ont pas été mal entrées dans ces bases de données.

Ici, les données nourrissent le fameux credit score étasunien, mais ces agrégats ont d’autres utilités : profilages psychologiques, publicités ciblées, campagnes électorales personnalisées, revente aux agences de renseignement ou d’investigation, etc.

Résumons : à travers cette liste non exhaustive, nous apercevons déjà des entreprises ayant les deux yeux sur nos actions quotidiennes, qu’elles soient numériques ou tangibles. Apparaît alors un second degré de collecte, moins évident pour le grand public, réalisé à des fins inconnues de ce dernier. Tout cela se fait, comme nous avons pu le voir dans le premier épisode, sans le consentement éclairé du citoyen, encore moins pour la partie concernant les data brokers. Il reste un point que nous n’avons pas abordé cependant : la sécurité. Toutes ces données sont stockées sur des serveurs sécurisés, ou du moins, qui devraient l’être. En effet, si nos données représentent une mine d’or d’information pour ceux qui les collectent légalement, elles le sont tout autant pour tous les autres. C’est ce que nous verrons dans le prochain épisode qui portera sur les fuites de données dues à une sécurité négligée.

Laisser un commentaire