Des sociétés comme Google ont bâti leur fortune en collectant des informations sur les habitudes des utilisateurs. Toutes les demandes, les mots-clés, les requêtes faites via leur moteur de recherche sont stockées et analysées, pour bâtir des profils de consommation.

En consultant toutes les requêtes que vous avez effectuées pendant quelques semaines ou quelques mois, on peut avoir une bonne idée de vos goûts, de vos intérêts, de votre mode de vie, de votre culture, bref de ce que les commerciaux appellent votre « profil ». Et c'est ce profil que commercialisent les fournisseurs de moteurs de recherche. Lorsque vous faites une recherche sur Google, il suffit qu'un commerçant ait acheté un mot-clé correspondant pour que vous voyiez apparaître, dans la liste des résultats, en regard de la demande, sa publicité. En août dernier, les requêtes de 650.000 personnes ont été rendues publiques sur Internet. Et différentes personnes ont pu être identifiées. Leur vie privée a été bafouée. Le responsable de cette énorme gaffe : un employé d'AOL.

 

 

658.000 UTILISATEURS MIS À NU

Numéro de sécurité sociale, adresse, numéro de téléphone, thème de la recherche et nombre de requêtes : un employé d'AOL a mis en ligne, par accident en août dernier, les recherches en ligne de 658.000 utilisateurs. Une véritable manne pour les annonceurs pour qui certaines recherches pouvaient être considérées comme des intentions d'achats pures et simples. Une aubaine aussi pour les marchands de Spam (courrier électronique non sollicité, ou courriel) et pour les hackers en tout genre.

 

 

A LA TRACE

Mais est-ce un incident ? AOL, qui vit grassement comme tous les moteurs de recherche de la vente des informations sur les coutumes et usages de ses membres, voulait faire la démonstration de la qualité d'un nouveau service permettant de mieux suivre encore le parcours d'un internaute, tout en garantissant la confidentialité des données en remplaçant l'identité par un code. Cette protection n'était pas suffisante et il s'est avéré relativement facile d'identifier, çà et là, les internautes concernés. Le fichier mis en ligne contenait 20 millions de requêtes recueillies sur une période de 3 mois.
On a constaté qu'une simple recherche dans celui-ci permettait de trouver leur propre nom ou celui des proches. Les données affichent clairement chaque requête effectuée avec les résultats qu'elle a donnés, et permet de voir sur quel résultat l'abonné a cliqué et sur quelle page il est arrivé. Même si le lien a été retiré en catastrophe par AOL après quelques heures, il est resté disponible un peu plus longtemps dans la mémoire cache de certains moteurs, dont Google. Et il a été téléchargé au moins 800 fois par des internautes dont certains ont mis en place des sites miroirs pour le rendre disponible. Bref, tout internaute, hacker ou société commerciale peut très facilement se procurer ledit fichier.

 

 

VOYEURISME

Au départ de l'affaire, AOL a reconnu son erreur mais a expliqué que les internautes n'étaient pas identifiables puisque le nom avait été remplacé par un code. Pour prouver l'inverse, le New York Times a retrouvé une retraitée à partir de ses requêtes, qu'il a interviewée et photographiée. « Mon dieu », s'est-elle exclamée, c'est toute ma vie qui est exposée. Je ne savais pas que quelqu'un regardait par-dessus mon épaule ! « Les voyeurs en tout genre se sont déchaînés et de nombreux forums glosent encore sur les habitudes de tel ou tel abonné mis à nu sur le net. Sur un blog, on trouve la vie dévoilée du couple 711391 dont on retrace des tranches de vie sur base de ses requêtes : comment se faire des amis en ligne, où trouver de la colle à tapisser, comment cesser les ronflements, comment faire bonne impression lors du premier rendez-vous « physique » avec quelqu'un rencontré sur Internet, comment trouver un motel discret, comment redevenir fidèle après avoir trompé son conjoint, comment ne pas être espionné, etc. On voit ainsi le couple 711391 se tromper mutuellement, le regretter, souffrir, et émailler le tout d'appels à Dieu, de questions sur les people et d'une interrogation sur le lesbianisme et la bisexualité. L'utilisateur 1045042, lui, cherche des relations entre les Républicains et le terrorisme. A 22h08, le 28963 a lancé une requête pour trouver des sites pornos gratuits. La 9652509, mère d'un bébé handicapé, effectue la requête : « Est-ce que quelqu'un adoptera mon bébé handicapé ? » Puis pose la question : « Comment éviter les pensées suicidaires ? » Un abonné pose la question : « Comment tuer sa femme ? » tandis qu'un autre matricule s'interroge sur le meilleur moyen de prévenir sa famille en cas d'inceste.

 

LA PUB SEULE COMPTE

Ce n'est pas la première « alerte » face à cette nouvelle forme de puissance de sociétés qui pistent en permanence nos us et coutumes sur Internet. Google, numéro 1 mondial des moteurs de recherche avec plus de 40% de part de marché des moteurs de recherche aux USA et plus de 80% au niveau des sites francophones, fonctionne selon un modèle économique orienté presque exclusivement autour de la publicité en ligne. Celle-ci représente ainsi 99% de son chiffre d'affaires. Google gère 400.000 annonceurs avec sa formule AdWords pour laquelle e-bay dépense par an plus de 180 millions d'euros. AdWords vient de " AD " pour ADvertising (publicité) et Words (Mots). Un annonceur peut acheter des mots-clés afin que son annonce apparaisse lorsqu'un Internaute lance une requête comprenant celui-ci. Le paiement se fait en fonction du nombre de clics effectués sur l'annonce. Cela va très loin : avec AdWords, les publicités sont non seulement affichées sur les pages de recherche Google (si vous tapez le mot-clé « voyage » des publicités de tour opérateurs vont apparaître), sur les pages des partenaires de Google (Amazone, AOL, Free, …), sur des sites personnels (si votre site personnel parle de voyages, des publicités ciblées apparaissent et Google vous paie un pourcentage du clic payé par l'annonceur qui commercialise des voyages), sur le webmail Gmail de Google (vous envoyez un mail contenant le terme voyage et des publicités ciblées apparaissent automatiquement).

 

L'UMP CLIENTE

C'est le parti de l'UMP, présidé par Nicolas Sarkozy, l'actuel ministre de l'Intérieur en France, qui le premier a décidé d'utiliser en politique le service AdWords de Google afin d'assurer sa promotion auprès de la population Internaute française. L'UMP a lancé sa campagne d'achat de mots-clés en novembre 2005 en optant pour un réservoir de 800 mots-clés dont certains sont choisis en fonction de l'actualité. C'est ainsi que racaille, banlieue, Mahomet et Outreau ont été réservés par l'UMP. La polémique a vu le jour début de cette année lorsque l'UMP a acheté des mots comme Jack Lang, Jospin, Ségolène ou Strauss-Khan. A chaque fois qu'un internaute lançait une requête avec ce nom, une publicité pour l'UMP apparaissait dans Google…

 

 

GOOGLE CENSURE

Si Google peut faire « apparaître » certaines informations, elle peut aussi en escamoter. On se souvient du tollé qu'a provoqué l'année passée la censure de la version chinoise de son moteur de recherche. Pour gagner le marché chinois, la société a accepté de se plier à la censure imposée par Pékin. Le moteur de recherche filtre ainsi les résultats proposés sur www.google.cn, tant le moteur de recherche que d'actualités, « pour se conformer aux régulations et lois locales ». En ligne de mire, les résultats issus de requêtes portant sur les questions politiques, jugées particulièrement sensibles pour le gouvernement chinois.
En février, le Washington Post publiait ainsi une liste de 236 mots-clés censurés. Ce n'est très certainement pas le seul cas de manipulation de l'information. Ariane Bek, rédactrice pour le magazine électronique Altermedia.info : « D'après le webzine britannique The Register, les utilisateurs de Google installés aux Etats-Unis ne peuvent plus accéder à certaines vidéos sur l'Irak. Ces images qui seraient accessibles sur Google en dehors des Etats-Unis montrent notamment des exercices de tirs effectués sur le sol irakien par les forces armées américaines - il n'est pas ici question de tortures et autres exactions. Quoi qu'il en soit, l'internaute qui aux Etats-Unis souhaite regarder ce document depuis Google Video est accueilli par ce message : « Nous sommes désolés mais le fournisseur de cette vidéo n'a pas autorisé Google à la diffuser sur votre territoire ». Surprenant, lorsque l'on sait que des scènes de bizutage musclées ou encore de porno trash sont librement visibles depuis Google Video (video.google.com) ! Toutefois, souligne The register, la surprise est moindre quand on prend conscience de la communication de Washington sur l'Irak post-Saddam Hussein, un Irak fantasmé loin des opérations militaires, des attentats et des humiliations. Moins surprenant encore, insiste le journal, lorsque l'on sait qu'au printemps dernier Google a embauché Dan Senor, un ancien responsable de la communication des Etats-Unis sur l'Invasion en Irak en 2003, sous la houlette de Paul Bremer ».

 

 

GOOGLE CONSERVE LES PROFILS DES INTERNAUTES

Pour cibler au mieux ses liens sponsorisés, la société archive et analyse les millions de requêtes effectuées chaque jour par les internautes. Une analyse « absolument nécessaire » selon Google, qui ne « met absolument pas en danger la vie privée des utilisateurs ». Or Google se refuse jusqu'à présent à nettoyer régulièrement ses bases de données, arguant que toutes les précautions nécessaires contre le vol ou l'obtention forcée d'informations ont été prises. Selon Google, le risque pour la vie privée est plus dans les velléités du gouvernement américain à exiger d'avoir accès à ces données que dans celui d'un vol ou d'un incident. Pour mémoire, le ministère de la justice américain, dans le cadre d'une loi sur la protection de l'enfance en ligne, a exigé de Google l'année passée qu'elle livre des données sur les requêtes de ses visiteurs. Le Département de la Justice a demandé à la société de lui fournir un échantillon, pris au hasard, d'un million de requêtes tapées par ses utilisateurs au cours d'une semaine. Ainsi qu'un second échantillon, composé d'un million d'adresses de sites web recensées par le moteur de Google. Les données réclamées devaient servir à vérifier la fréquence à laquelle les internautes tombent sur des sites à contenus pornographiques et à mesurer l'efficacité des filtres mis en place. Google a refusé au nom de la protection de la vie privée, à l'inverse de Yahoo, MSN et AOL qui ont répondu favorablement à la demande. La question ne se poserait pas si Google et les autres fournisseurs de moteurs de recherche « vidaient » régulièrement leurs fichiers des historiques des requêtes. Mais Google est trop conscient de l'importance de son trésor de guerre pour consentir à de la transparence sur ses méthodes de stockage et d'analyse. Ce qui compte à ses yeux, c'est de récolter un maximum d'informations pour établir un profil toujours plus pointu des internautes qui font appel à ses services, afin d'améliorer l'impact des publicités en ligne et des liens sponsorisés.

 

 

MÉTAMOTEUR PROPRE

C'est pourquoi on saluera des initiatives comme celle d'Ixquick Meta Search, un méta moteur qui a décidé en juin dernier d'effacer toutes les données personnelles de ses utilisateurs contenues dans ses fichiers journaliers. Le moteur de recherche d'Ixquick permet à l'utilisateur de lancer une recherche à partir de 12 moteurs de recherche (dont Google, Yahoo, MSN, Alta Vista, Wikipedia, Excite et All the web) sans que ceux-ci ne puissent enregistrer leurs données personnelles. A recommander donc, même si on est obligé de faire confiance à la bonne foi d'Ixquick quant à la réalité de cet effacement.