Cerveaux contre Machines

Vous n’êtes qu’un humain. Un humain seul a des capacités limitées. Il est lent, il se fatigue, il a peu de mémoire, il n’est pas omniscient. Sans compter, qu’il y a peu de génies et de champions. Pour dépasser ses limites, l’humain a deux solutions : se regrouper en communauté ou s’outiller. Travailler en collaboration ou utiliser un ordinateur (ou plusieurs) ? Quelle est la meilleure option ? Cet article vous donnera un aperçu d’exemples notoires portant sur la réalisation de tâches intellectuelles afin de vous faire votre propre opinion.

Vous devez accomplir une tâche surhumaine

Il y a 50 ans en arrière, une ou deux personnes étaient nécessaires pour analyser les quelques centaines de bytes de données recueillies par les sondes lors d’expéditions dans l’espace. Désormais, ce sont parfois des centaines de térabytes (voire 1 pétabyte) de données par seconde que les sondes ou les télescopes sont capables de collecter. Les images capturées sont incroyablement précises et extrêmement précieuses. Elles permettent à la fois d’observer des objets célestes déjà connus et d’en découvrir de nouveaux.

Machines

Les ordinateurs sont faits pour réaliser des tâches pénibles car longues ou répétitives pour les humains. Depuis 1999, le projet SETI@home de l’université de Californie se poursuit dans l’espoir de détecter une présence de vie extraterrestre. La puissance de calcul d’un réseau d’ordinateurs d’un grand nombre de particuliers, est mise à contribution, via internet, pour analyser les données numérisées et découpées en petits tronçons (ou unités de travail) issues d’un radiotélescope (celui d’Arecibo à Puerto Rico). Si le calcul distribué s’est révélé fonctionner parfaitement, et rendre possible l’analyse qui aurait demandé autrement un temps considérable, aucun signal extraterrestre n’a encore été trouvé à ce jour.

Cerveaux

Les ordinateurs ne sont pas toujours brillants lorsqu’il s’agit de comprendre des images. Luis von Ahn, ayant contribué au système captcha (2000) avait d’ailleurs élaboré un système (baptisé reCaptcha) permettant de faire transcrire numériquement petit à petit des morceaux de livres anciens par les visiteurs des sites, afin de pallier les échecs des systèmes de reconnaissance optique sur la même tâche. Les internautes recopiaient petit à petit le livre en recopiant le captcha.

Mais revenons au champ de l’astronomie. Quand la sonde spatiale stardust est revenue sur Terre après 7 ans de mission, elle avait collecté de la poussière d’étoile de comètes d’environ 1 micron. Afin d’en retrouver les grains, les scientifiques ont eu l’idée de faire analyser les 1 million et demi de photographies du collecteur par des bénévoles. 30000 personnes ont ainsi contribué au projet stardust@home, la première initiative de ce genre. La plateforme Zooniverse a depuis été ouverte pour les recenser et recruter des collaborateurs.

Cerveaux et Machines

Le projet Galaxy zoo est lancé en 2007 par des chercheurs de l’université d’Oxford. Il répond au besoin d’analyser l’importante masse de données (50000 galaxies) fournie par un télescope optique grand angle du nouveau Mexique (Sloan Digital Sky Survey). Les volontaires doivent classifier les galaxies en fonction de leurs caractéristiques physiques. En effet, leur forme et leur couleur permettent non seulement de donner leur nom mais aussi indiquent aux spécialistes leur composition chimique. En 2009, l’UCLA (Université de Californie à Los Angeles) utilise ces données manuellement étiquetées en tant que training set à leur algorithme d’apprentissage et parviennent ainsi à discriminer correctement les galaxies d’un autre projet (Dark Energy Survey).

Ce même procédé est utilisé dans l’étude des surfaces de sols des astres et des astéroïdes. En effet, les ordinateurs, perturbés par les variations de lumière, échouent à repérer les aspérités de terrain, là où les humains n’ont aucune difficulté. L’étiquetage résultant du projet Moon Mapper visant à marquer tous les cratères de la lune, va ainsi pouvoir entraîner les algorithmes d’intelligence artificielle pour accélérer cette tâche fastidieuse. Cela permettra ainsi de repérer le meilleur emplacement pour faire atterrir sans encombre une navette dans de nouveaux mondes à explorer.

Le principe de collaboration de l’intelligence humaine et de la machine pour atteindre un objectif qu’ils ne peuvent réaliser seuls est appelé Human-Based computation.

Vous avez un problème très complexe à résoudre

C’est ce qui arrive fréquemment aux chercheurs, tels que le biochimiste David Baker de l’université de Washington. Il tente de comprendre le complexe repliement des protéines dont la forme finale va induire le rôle dans le corps humain, afin d’ouvrir la possibilité de traitements contre certaines maladies.

Machines

Dans un premier temps, il commence par concevoir un programme pour tester les pliages et dépliages. La puissance de calcul nécessaire était telle que l’unique solution était d’avoir recours à des milliers d’ordinateurs. Il lance donc le projet Rosetta@home (2005), qui comme le projet SETI@home fait appel à des bénévoles pour qu’ils prêtent la capacité de calcul de leur ordinateur au travers d’internet. Malheureusement, cela ne suffit pas.

Cerveaux

Dans un second temps, en 2008, il conçoit un nouveau programme : un jeu pour les humains nommé “FoldIt”. A la manière d’un casse-tête, en collaboration, les joueurs doivent plier un brin de protéine jusqu’à peut-être obtenir la forme réelle de la molécule. Un système de points évalue leur solution afin de les guider dans la bonne direction. Depuis le système n’est pas encore parvenu au résultat mais fait des progrès prometteurs. Dans le même temps, David Baker avait lancé l’expérimentation du même système sur un autre problème complexe pour lequel la solution algorithmique n’avait pas abouti à un résultat : la reproduction de la structure de la protéine rétrovirale Mason-Pfizer monkey virus (responsable du SIDA chez le singe). Il fallut 10 jours pour résoudre ce mystère depuis 15 ans. Avec cette méthode la solution émerge petit à petit des expérimentations : les bonnes idées restent, les mauvaises sont effacées. Un paramètre doit néanmoins faire consensus : la mesure de qualité d’une solution.

Ce type de jeu ayant explicitement ou implicitement un objectif autre est appelé un GWAP (game with a purpose).

Vous voulez battre un champion d’échecs

Tel Garry Kasparov, champion du monde de 1985 à 2000. Parce qu’être un champion d’échecs c’est être considéré comme très intelligent.

Machines

Dans cet objectif, le défi pour la machine est de parvenir à anticiper le très grand nombre de possibilités. En effet, rien que pour le premier coup d’une partie il y a déjà 400 positions différentes et le nombre de parties différentes est évalué à 10¹³⁰. La première piste envisagée, tester toutes les combinaisons (force-brute), implique que la victoire sur l’humain soit corrélée à la puissance de calculs de la machine. Elle est améliorée par le recours à des algorithmes qui éliminent les combinaisons les moins intéressantes afin de réduire la complexité. A partir de 1970, des championnats annuels de programmes d’échecs sont organisés en Amérique du nord. En 1989, Kasparov affronte le programme gagnant de 1988, Deep Thought, un superordinateur qui calcule 720 000 coups/s, et le bat. En 1996, il gagne encore contre deep blue , développé par les mêmes chercheurs désormais employés par IBM, un supercalculateur de 265 processeurs en parallèle qui calcule entre 50 et 100 millions coup/s. Mais, l’année suivante, il perd contre Deeper Blue, la version optimisée de Deep Blue, capable d’anticiper de 100 à 300 millions de coups/s, en match singulier, à cadence normale. Depuis cette époque, les meilleurs humains ne battent plus une machine aux échecs.

Cerveaux

Quelques années plus tard, en 1999, via la plateforme MSN Gaming Zone de Microsoft, 50000 joueurs de tous niveaux résidant dans 75 pays tentent de battre le champion du monde. Chaque coup joué par le collectif est décidé après un vote majoritaire sur l’ensemble des propositions collectées pendant 24h. La partie dure 4 mois. Au premier coup, la foule (qui joue en second) riposte par la meilleure défense possible (défense sicilienne). Le niveau est élevé. Le 10eme coup totalement inédit est si mémorable pour la communauté des joueurs d’échecs qu’il est enseigné depuis. Kasparov l’emporte malgré tout de justesse.

Vous voulez deviner une réponse

Machines

Deviner à quel personnage vous pensez, c’est le défi que lance le programme Akinator aux joueurs depuis sa création en 2007 par la société française Elokence. Après une série de questions bien choisies, c’est-à-dire tranchées, objectives et dont les réponses éliminent le plus de possibilités, il propose une réponse au challenger. Si elle s’avère fausse la réponse vient enrichir à la base de données. Chaque partie peut être vue comme une contribution du joueur pour définir un personnage, rendant possible pour Akinator l’apprentissage et la vérification de ses données. 66% des réponses du 1er essai seraient exactes et 85% au second. Il échoue principalement sur les cas sujets à interprétations (tel que Dieu) ou ceux n’ayant pas de traits déterminants. La société conceptrice ambitionne d’élargir le champ d’application de son système en le faisant évoluer vers “une aide au choix” dans le secteur touristique ou encore aux diagnostics techniques. Elle continue à garder son algorithme secret.

Le programme Quickdraw, développé par la Magenta Team de Google en 2016, quant à lui, utilise un réseau de neurones pour reconnaître les dessins faits à l’ordinateur, par les visiteurs de son site. Dans ce jeu classique, vous devez dessiner (avec votre souris !) le mot demandé en moins de 20 secondes, tandis que le programme suggère de manière orale des propositions. Les données récoltées, 50 millions de dessins répartis dans 345 catégories, sont mises à disposition en open-source pour qui veut expérimenter. Ainsi, Mauro Martino, Hendrik Strobelt et Owen Cornec, dans leur projet Forma Fluens, ont pu superposer des centaines de milliers d’étapes de dessins d’un même concept (“panda”, “oeil”…). Ces images saisissantes révèlent à la fois que “200 000 personnes dessinent à peu près de la même manière” et des différences culturelles marquées telles que les représentations variées de “prises” d’un pays à un autre.

Cerveaux

Il a été démontré que le jugement moyen d’une foule d’humains lambda vaut celui d’un expert pour estimer une réponse. Ce phénomène a été décrit pour la première fois dans une publication de 1907 de Sir Francis Galton dont l’objet était de démontrer ironiquement la stupidité de la foule (idée largement répandue à l’époque). Il s’est procuré les bulletins de réponses d’un concours d’estimation du nombre de kilos de viande que produira un bœuf lors de la foire de Plymouth en 1906. Il a noté avec étonnement (sans tirer les bonnes conclusions), que s’ils contenaient bien un grand nombre d’erreurs diverses comme il l’attendait, en revanche la moyenne des réponses était très proche de la vérité soit 542 kg au lieu de 543 kg. Le même phénomène s’est produit, lors du projet Moon Mappers, déjà évoqué dans cet article, où, d’après l’astronome Pamela Gay, il a été observé que les résultats de la moyenne des volontaires novices étaient plus précis que ceux d’un expert astronome.

De nos jours, la communauté scientifique s’accorde à dire que c’est justement la diversité des erreurs qui est le facteur déterminant. Les réponses sont comme autant de fléchettes sur une cible où chaque participant aurait tenté de viser le centre (la bonne réponse) en ratant dans une direction différente à chaque tir. La moyenne des lancers donnera la position du centre. Cependant, obtenir des conditions de probabilités telles que celles du lancer sur une cible n’est pas si aisé. Les résultats peuvent être particulièrement faussé si l’on est influencé de quelque manière que ce soit comme par exemple en ayant connaissance de la réponse des autres.

De nombreuses autres tâches comme analyser des images, informer, recommander, prévoir ou traduire auraient pu être abordées ici et de nombreux autres exemples cités décrivant des approches. N’hésitez pas à partager les vôtres.

Sources

Source principale : “Fouloscopie, ce que la foule dit de nous” (Mehdi Moussaïd) (livre et blog)
Autre source : https://interstices.info/les-echecs-electroniques-histoire-dune-confrontation-entre-lhumain-et-la-machine/
Autre source : Pamela Gay, astronome, à la conférence NCrafts https://www.youtube.com/watch?v=xjbs51QB7LQ
https://fr.wikipedia.org/wiki/Luis_von_Ahn a travaillé sur le captcha, reCaptcha et le concept de Human Computation.
https://en.wikipedia.org/wiki/Rosetta@home
https://www.zooniverse.org/projects/zookeeper/galaxy-zoo/
https://www.darkenergysurvey.org/
https://quickdraw.withgoogle.com/?locale=fr
Projet avec les données collectées par quickdraw http://formafluens.io/
Akinator https://www.elokence.com/fr/content/9/akinator , https://fr.akinator.com/, https://www.nouvelobs.com/rue89/rue89-tech/20100114.RUE4437/comment-marche-akinator-le-site-qui-lit-dans-vos-pensees.html

Autour du sujet

La Sagesse des foules est un livre écrit par James Surowiecki,2004
Psycho-Pass (2012-2013) est une série d’animation dystopique où une intelligence artificielle (le système Sybille) juge du potentiel de criminalité des citoyens japonais.