Par Jean-Luc MANISE

 

 

 

C'était le sujet, ce 14 décembre, de la conférence organisée à PointCulture Botanique par MediaAnimation. Professeur à l'UQAM de Montréal, Mélanie Milette se penche depuis une dizaine d'années sur les usages et enjeux citoyens des médias sociaux.

 

 

Mc Afee arrêté à cause d'une photo

Mélanie Millette :«Lorsque le 13 novembre 2012, la police se rend sur l'île d'Ambergis Cayes pour y entendre John Mc Afee à propos du meurtre de son voisin, l'homme a déserté. Quelques jours plus tard, le magazine Vice publie une interview du créateur du célèbre logiciel de sécurité où il explique les raisons de sa fuite. L'article est accompagné d'une photo de l'ex-dirigeant américain. L'entretien a eu lieu «quelque part dans le monde». Mais des métadonnées sont attachées à cette image. Elles renvoient à un restaurant situé au Guatémala. McAfee sera arrêté et expulsé vers les Etats Unis. Mélanie Millette: «C'est l'une des illustrations de ce que ces fameuses métadonnées que même des professionnels du numérique ont souvent tendance à négliger peuvent avoir des conséquences très importantes sur nous.»

 

 

2,5 quintillons de bytes par jour

Les algorithmes sont constitués par une suite d'opérations mathématiques. Ils ont pour fonction de trier l'information selon certains critères établis par des personnes qui en ont pensé chacune des variables et leur ont attribué un poids. "Ce sont des facilitateurs, des catalysateurs, des assistants de prise de décision dans un monde où le volume d'informations générées est en augmentation exponentielle. On estime que 90 % des donné'es produits sur le net l'ont été dans les deux dernières années. Chaque jour, on produit 2,5 quintillons de bytes. C'est pharamineux!"

 

 

Que veut-on faire faire aux algorithmes ?

Leur grammaire est la plupart du temps tenue secrète. Ce sont des boîtes noires, protégées par des brevets de propriété intellectuelle. Mais certains, comme CineMatch, ont été en partie rendus publics. «C'est NetFlix lui même qui l'a rendu populaire en lançant en 2009 un concours auprès des programmeurs. Le but était d'améliorer de 10% l'efficacité de son outil de suggestion et de recommandation de contenus. Pour ce faire, les ingénieurs de NetFlix ont largement documenté leur algorithme. C'est ainsi que l'on sait que, derrière la variable utilisateur, on trouve notamment le genre déclaré de la personne, le code postal, les références de son quartier ou encore le profil idéologique de la personne. Reste que rendre un algorithme public, c'est à dire publier son code source, ne rend pas directement «lisible» les intentions de ceux qui l'ont conçu, tant le nombre de variables est important et les corrélations complexes».

 

 

Recommandation numérique

C'est pourquoi il vaut mieux se pencher sur les finalités recherchées par ses concepteurs. Ici, NetFlix s'appuie sur 4 grandes catégories d'algorithmes. «Search» va recenser les recherches de ses abonnés et les films et séries qu'ils ont le plus souvent regardés ensuite. «PVR» va générer un catalogue personnalisé en fonction des habitudes de visionnement. «CineMatch» a pour fonction d'anticiper le nombre d'étoiles qu'un abonné va attribuer à un programme. «ARO» déterminera enfin l'ordre dans lequel les rubriques apparaîtront sur la page d'accueil des abonnés. L'objectif: nourrir le moteur de recommandations du service en ligne de vidéos et anticiper le degré d'intérêt des utilisateurs pour une série ou un film. "C'est en prenant conscience de l'existence et de la logique de tels mécanismes que l'utilisateur, le citoyen, peut récupérer une certaine maîtrise de son environnement numérique."

Pour la chercheuse de l'UCAM, la plupart des utilisateurs ne sont pas conscients des mécanismes et des effets recherchés par des algorihtmes comme PageRank & EdgeRank. Très peu de personnes savent ainsi que c'est seulement une infime partie des publications publiées par un membre du réseau Facebook qui apparaît sur le fil d'actualité de ses amis : entre 5 à 7 % en raison des tris et classements opérés. Mélanie Millette: "Facebook a ainsi confié à son algorithme la responmabilité de limiter la portée des publications de ses membres.  Ses deux premiers critères de sélection sont le potentiel initial de "buzz" (si le message  est beaucoup liké, partagé ou commenté, l’algorithme va en accroître la diffusion), ou le côté payant d'informations sponsorisées."

 

 

PageRank : tapis rouge pour les grandes marques

PageRank, du nom de son créateur Larry Page, a été programmé pour diriger le moteur de recherche de Google en 1998. Si les formules et les variables qui le composent ne sont pas publiques, il fait depuis toujours l'objet de nombreuses analyses, notamment des agences de référencement. En 2005, l'introduction de la fonctionnalité de recherche personnalisée a définitivement assis le succès du moteur de recherche en permettant d'afficher des résultats qui prennent en compte les préférences et recherches passées des utilisateurs, les renvoyant dans un univers de plus en plus familier. En 2008, Google a introduit la fonction de suggestion qui affiche en temps réel, dans la zone de recherche, des suggestions de recherches à partir de celles déjà réalisées par d'autres utilisateurs du moteur de recherche. L'année suivante, une important mise à jour ouvrait la porte à la différenciation du poids des contenus en fonction de l'importance économique de son producteur. Vince, c'est le nom de la variable, déroulait le tapis rouge pour les grandes marques.

 

 

L'émergence du mobile

La recherche en temps réel date de 2009, la prise en compte des posts sur réseaux sociaux de 2010. Un an plus tard, une variable donnait plus d'importance au site produisant régulièrement des contenus «frais». En 2013, ce sont les contenus plus long, les articles de fonds qui seront mieux pris en compte. PageRank prendra encore au fut et à mesure des mises à jours les indices de recherche locale (quand on cherche un commerce dans sa ville par exemple) ou encore les sites «responsive» c'est à dire adaptés aux smartphones et tablettes.

 

 

Facebook : une ligne éditoriale basée sur le poids et l'argent

L'algorithme de Facebook s'appelle EdgeRank. Mélanie Millette : "L'un de ses principes de base est l'homophilie des réseaux. Prenons la variable «Affinité». Elle est calculée en fonction des pages que vous aimez et des contenus que vous partagez. L'algorithme va comparer votre profil avec celui des gens avec qui vous interagissez. Plus les profils seront similaires, plus la chance sera grande de voir apparaître les contenus sur le fil d'actualité. La variable «Poids» calcule la performance de la publication : le nombre de mentions j'aime, le nombre de clics pour agrandir le contenu, le temps passé sur l'info, les performances passées, le nombre de partages... Facebook prend également en compte et privilégie les contenus récents et, qui s'en étonnera, accorde de plus en plus de poids aux pages sponsorisées."

 

 

Maîtriser et préserver sa vie numérique

Face à ce qui ressemble de plus en plus à une logique d'impéralisme numérique de majors américains, il devient de plus en plus important de travailler à ce que les internautes prennent conscience de ce qui se joue dans les réseaux sociaux  afin de pouvoir récupérer une certaine maîtrise dans la conduite et la préservation de leur vie numérique. Des gestes simples, des contrôles de ce que les médias sociaux savent de nous sont tout à fait possibles via des outils comme la fonction «Mon compte» de Google ou le profil publicitaire de Facebook. On peut bloquer les publicités, effacer régulièrement les cookies, multiplier les pseudos, bref, on peut dérouter les algorithmes. On peut aussi s'immerger dans les suites alternatives, campagnes Framasoft et autres moteurs DuckDuckCo. Cela n'enlève rien à la nécessité et à l'urgence de militer pour une plus grande transparence des algorithmes qui conditionnent et cadrent en temps réel l'accès aux informations et qui président de plus en plus aux décisions qui sont prises à notre égard. Si la transparence est nécessaire, elle n'est pas suffisante. Il faut aussi donner plus de contrôle au citoyen sur ce qui est fait de ses données, sur la manière dont elles sont collectés, traitées et commercialisées. Le nouveau règlement européen général relatif à la protection de données à caractère personnel (RGPD), qui entrera en vigueur en mars de l'année prochaine, est en ce sens un bon pas en avant. Et l'on suivra avec beaucoup d'attention la suite qui sera donnée au procès qui oppose la Commission Belge de la Vie Privée à Facebook sur ce sujet.