Tournesol : l’algorithme d’utilité publique qui a besoin de vous !

Author:

Une récente plateforme développé par des chercheurs en informatique tente de récolter un maximum de données afin de cerner les préférences humaines en matière de contenus. Son objectif final : lutter contre la désinformation et la mésinformation sur le Web. Futura s’est entretenu avec le président de l’association Tournesol, Lê Nguyên Hoang, chercheur en informatique et vulgarisateur scientifique à l’École polytechnique fédérale de Lausanne. 

Avez-vous déjà réfléchi rétrospectivement sur la qualité des contenus que vous consommiez sur Internet et plus particulièrement sur les plateformes de vidéos ? Que préférez-vous regarder lorsque vous souhaitez vous informer sur un sujet ? Comment jugez-vous l’information ? Des universitaires suisses ont développé un algorithme dont le but final est d’améliorer les recommandations en matière d’informations. Ils se penchent actuellement sur ces questions et ont besoin de vous. Pour ses lecteurs, Futura a interrogé le président de l’association Tournesol, Lê Nguyên Hoang, chercheur en informatique et vulgarisateur scientifique à l’École polytechnique fédérale de Lausanne.

Futura : Quand et comment est né le projet Tournesol et quel rôle a joué le contexte informationnel dans ce projet ? 

Lê Nguyên Hoang : La problématique des algorithmes de l’information, en général, et des algorithmes de recommandations de contenus sont des questions qui trottaient dans ma tête depuis presque une décennie, à mes débuts en tant que vidéaste sur YouTube. Depuis environ cinq ans, je me suis familiarisé avec la recherche académique dans ce domaine et j’y ai réfléchi plus longuement avec des collègues de mon laboratoire. Beaucoup d’événements sont venus alimenter notre réflexion et renforcer notre conviction qu’il y avait là un problème à résoudre, comme le scandale de Cambridge Analytica, et nous ont conduit à publier le livre Le Fabuleux Chantier (edp sciences) en 2019.

Mais le déclic a vraiment été la pandémie de Covid-19. Jamais autant de désinformation et de mésinformation de masse n’avait circulé sur un sujet donné. Dès lors, notre conviction que la vulgarisation scientifique était d’une importance cruciale s’est renforcée. Il fallait que les informations primordiales puissent se transmettre sans problème et ne soient pas diluées dans un océan de fausses informations ou d’informations moins dignes d’intérêt à ce moment-là.

Depuis la genèse du projet, nous pensons que les algorithmes des réseaux sociaux et des plateformes qui diffusent ces contenus ont un rôle primordial à jouer dans le combat pour la diffusion d’une information d’utilité publique à grande échelle.

Au début de la pandémie, j’ai contacté un ami qui travaillait chez Google et je lui ai dit qu’il fallait absolument modifier les algorithmes pour parfaire les recommandations de contenus. Il m’a dit qu’il était d’accord avec moi mais il m’a posé cette question : « Quelles vidéos devraient être mises en avant selon toi ? » C’est à ce moment que j’ai compris que cette question qui m’avait parue si simple pendant des années était en réalité d’une complexité abyssale.

Futura : Comment fonctionne Tournesol ? 

Lê Nguyên Hoang : Avant de parler du fonctionnement de Tournesol, il faut rappeler brièvement son objectif actuel. La plateforme est actuellement une sorte de  microscope sur les préférences et la façon dont les humains font des jugements. L’objectif actuel est simplement de  collecter un maximum de données sur quels sont les contenus que les gens jugent préférables à recommander massivement. Pour le fonctionnement de Tournesol, ma dernière vidéo parle justement de cela en détail. Très brièvement, il permet de comparer deux vidéos entre elles selon plusieurs critères que nous jugeons pertinents pour considérer un contenu d’utilité publique ou non. On a fait ce choix car des théories en psychologie suggèrent que nos jugements sont plus fiables et ont plus de valeurs informationnelles lorsque l’on fait des comparaisons que lorsque l’on évalue quelque chose de façon individuelle. À partir des avis des contributeurs, l’algorithme génère un score qui retranscrit l’utilité de la vidéo à partir des préférences des utilisateurs. 

Futura : Nous avons testé Tournesol. N’y a-t-il pas un problème sur le fait que tous les avis aient le même poids, par exemple sur le critère de fiabilité ? 

Lê Nguyên Hoang : Comme je le disais précédemment, l’objectif actuel de Tournesol est vraiment de comprendre comment les gens évaluent les contenus. À côté de cela, nous invitons nos contributeurs à renseigner des informations personnelles. Par exemple, leur âge ou leur niveau d’études. Lorsque nous aurons construit une base de données solides qui peut d’ores et déjà être téléchargée depuis la page d’accueil de Tournesol, nous espérons que d’autres chercheurs se pencheront sur l’analyse de ces données et que nous pourrons, collectivement, concevoir des modèles plus précis afin de pallier les différents biais comme celui de la subjectivité et du poids égal de la notation.

Futura : Quand pourra-t-on voir Tournesol « sévir » à grande échelle ? 

Lê Nguyên Hoang : La première version de Tournesol est déjà active. Sur Twitter par exemple, vous pouvez dores et déjà interpeller le bot Tournesol pour lui demander son avis sur une vidéo. Nous allons également développer une extension compatible avec Firefox et Chrome pour que l’information sur une vidéo donnée apparaisse à chaque fois qu’un utilisateur consomme du contenu.

C’est une façon de rappeler aux gens que faire attention à la fiabilité de l’information est quelque chose de crucial. Pour revenir à la question, afin que Tournesol produise des recommandations fiables à grande échelle, ce dont nous avons vraiment besoin, c’est de contributeurs.

Le problème actuellement, c’est que nous avons une politique stricte concernant la validation des comptes pour protéger Tournesol contre ce qu’on appelle communément l’attaque des 51 %, qui reflète l’influence que peuvent avoir les faux comptes qui sont actuellement la norme sur internet. Par conséquent, nous n’acceptons que des domaines d’e-mail de confiance. Nous réfléchissons à des alternatives pour résoudre ce problème.

Néanmoins, j’invite toutes les personnes qui lisent l’article, si elles le souhaitent, à aller faire un tour sur notre site et à noter des vidéos. Chaque contribution nous permet d’avancer un peu plus vers un monde où les recommandations d’informations seront, je l’espère, plus robustement bénéfiques. 

Leave a Reply

Your email address will not be published. Required fields are marked *