Grégoire Hébert@GregoireHebert
Senior developer, trainer, lecturer.
CTO at Les-Tilleuls.coop
GA enthusiast.
Foods and drinks lover.

You want to work with me ?
  La Coopérative des Tilleuls   +33 618864288   @gheb_dev   [email protected]   https://les-tilleuls.coop    Lille (59), France

As we used to think

11 Nov 2020

Mon arrière-grand-père, je le connais... pas très bien...

Il est presque tout, pour moi, il a fait des études toute sa vie, mais n’a jamais eu de diplômes. Du coup, il est presque tout. C’est un grand gaillard d’1m90, bon vivant. Dans Lucky-Luke, il y a un peintre capable de manger 12 poulets et 2 bouteilles de rouge à midi et de recommencer le soir.. Bah voilà. Lorsqu'on va au marché, on croise ses copains, on s'arrête au troquet, on prend un café et il raconte sa vie.

Comme ses histoires sont longues, souvent ses copains nous accompagnent, pour rentrer. Il termine l'histoire en route. Ce n’est pas très grand chez lui, mais j'aime bien son fauteuil vert, juste sur le pas du balcon l'été avec un peu d'air frais alors qu'on a les avant-bras qui collent sur la table en formica. Et on le tourne vers le faux poêle à bois, l’hiver, avec le tapis qui se retrouve bosselé, parce qu’il ne soulève pas le fauteuil.

Pendant sa jeunesse, dans les années 30, il vivait aux États-Unis d’Amérique.
À cette époque, il invente le faux plat. Il est pénible n’est-ce pas ?
Sans lui, avant ce n'était que du plat. Ceux qui font du vélo, ou qui courent, vous prenez une même route chaque jour et ça va. Un jour, au détour d’une discussion :

Au détour d'un café
Vincent
12:45
Ah, toi aussi tu passes par là ?
Vincent
12:46
Il fait mal aux jambes ce faux plat, je préfère le prendre en descendant le matin.
Greg
12:46
Comment ça ? En descendant ? Quel faux plat ?

Et le soir, tu réalises qu’il a raison. Que ce jour-là, tu es à bout de souffle à la moitié de la rue. Rien à voir avec les 2 burgers frites du midi… Enfin bref !

Comme il est presque ingénieur en génie civil, il a inventé le traceur de profil avec Vannevar Bush, enfin surtout Vannevar, lui aussi ingénieur. C’est comme un vélo avec une grosse boîte en bois, quand les roues tournent ça déroule le papier, et une aiguille en fonction de l’inclinaison va dessiner le profil de la route.

À 29 ans, comme il était presque agrégé de mathématiques, ils inventeront, enfin surtout Vannevar, une machine à calculer les équations différentielles. Il voulait résoudre des problèmes de circuiterie électrique, mais est resté bloqué sur une équation vraiment difficile à résoudre, alors il a décidé de créer un outil pour le faire. En plus de résoudre des problèmes de transmission d’énergie dans un réseau, ce monstre de métal a aidé à résoudre des problèmes en physique, en sismologie et en balistique. Moi, si je regarde mon Instagram au même âge, je suis juste fier de savoir faire une brioche.

Un peu plus tard, il devient petit à petit obsédé par l’organisation des informations. Le FBI stocke les empreintes digitales et les trie à partir de l’index droit. Si, pour n’importe quelle raison, l’empreinte de l’index est perdue, que le type se sectionne l’index, ou se ponce le bout des doigts, il devient impossible de le retrouver, il devient un inconnu pour la justice. Pratique non ? Son idée, c’est de générer un code à 12 caractères, unique pour un document, et donc relié à une personne. Son idée va même un peu plus loin. La technologie favorite pour transmettre beaucoup d’informations sur une petite surface, c’est le microfilm. Les James Bond s’en inspirent beaucoup. Son invention s'appelle le sélecteur rapide. On vient poinçonner un code sur le bas d’une bande pour former un masque de sélection, lorsque la lumière passe, elle active une cellule photo. Lorsque le masque complet correspond à l’entrée attendue, la bande s’arrête et l’on peut projeter le contenu de l’image. Mais le FBI n’a pas compris l'intérêt de la machine pendant la présentation.

Ça aurait été dommage de rendre la justice efficace. Ils auraient démasqué les membres de la Yddish Connection trop vite... Vous connaissez « Abe kid twist » ? Il a assassiné 1000 personnes entre les années 30 et 40, à coups de pic à glace derrière l'oreille, enfin bref, sympa le club de sculpture. Et c'est un seul spécimen parmi des dizaines dans la même période. C’est dire l'ambiance de l'époque, ah il savaient se marrer. Aujourd'hui si tu parles un peu fort, tu te retrouves en garde à vue. Tu fais de la musique, mais tu es noir ? Passage à tabac par les flics. Tu détournes des millions pendant les présidentielles, hop, confiné chez toi. Ah non, il ne fonctionne pas celui-là.

Il se fait tard, je vais devoir rentrer, j’écouterai la suite de son histoire demain.


Mais le lendemain, il est d’une humeur fracassante. Il ne trouve plus sa veste, il jure l’avoir mise là. Impossible de s’y résoudre, quelqu’un lui fait une farce. L’enquête démarre.

Avec Vannevar, ils voulaient aider et améliorer le quotidien. L’obsession pour l’organisation est grandissante. L’être humain ne cesse de créer des extensions de lui-même et d'améliorer ses capacités. La force ? Pelleteuses, tracteurs, alcool… Ah si : moi après 3 bières, je peux faire un concours de bras de fer ou de pompes et défier le bar entier. La vue ? Des microscopes, des télescopes, l’alcool… Ah si : après 3 bières de plus, je vois mieux en penchant la tête sur le côté, alors que sobre, pas tellement. C’est bien que j’ai amélioré quelque chose ! Bref, on avait de quoi aider le corps, mais pas l'esprit, l'organisation de la connaissance.

Vous aussi, quand vous ne trouvez pas un truc, vous cherchez dans des endroits improbables ?

Dans l'appartement
Pépé
08:32
As tu regardé sous le … ?
Greg
08:32
Le ?
Pépé
08:32
Mais rah si, le…
Greg
08:32
Le canapé ? Pourquoi veux-tu qu’elle soit là ?
Pépé
08:33
Raah, regarde je te dis. Je vais voir dans le frigo.

Un peu plus tard avec Vannevar, enfin surtout vannevar, ils ont travaillé avec le président des États-Unis d’Amérique. Au tournant de la Première Guerre mondiale vers la Seconde, l’Administration est un bordel organisé, et celle des militaires encore plus. Il faut coordonner toutes les agences en place et presque tous les documents sont envoyés en 3 exemplaires à chacune d’elles, sur papier. Alors que Vannevar est à la tête de l’OSRD Office of Scientific Research and Development, lors de la première année de la guerre de 1939, 650 000$ d’impression et pas loin de 50 M$ en équipement de reproduction sont dépensés. 1 an. Le sélecteur rapide aurait pu être une solution, mais l’outil ne sera pas retenu. Malgré tout, le travail de Vannevar, ses recherches, ses méthodes et son implication dans le projet Manhattan auront un impact conséquent sur l'issue de la guerre. Certains qualifient son travail comme une des raisons de la victoire des Américains.

Durant cette période, Vannevar réfléchit beaucoup. Il écrit d’abord une pensée, puis un papier un peu plus long ou il rassemble ses idées. Il le publie sous la forme d’un essai intitulé Mechanization and the Record. Dans ce document, il décrit un appareil, basé sur des technologies de bas niveau inspiré de l’organisation du savoir, à l’instar du cerveau humain.

Dans l'appartement
Pépé
09:17
Où est cette foutue veste…
Greg
09:17
Sur ton porte manteau tu as regardé ?
Pépé
08:32
Ah ne me prends pas pour plus sénile que ne le suis ! elle n’est pas sur le... ah si.

Comme mon arrière-grand-père était presque ingénieur mécanicien, avec Vannevar, ils ont imaginé un bureau mécanique, enfin surtout Vannevar. C'est un bureau normal sauf qu'au milieu de la console il y a une vitre de verre sur laquelle on projette le contenu d'un microfilm, comme le permet le sélecteur rapide. Dans les tiroirs de part et d'autre du bureau, il y a énormément de microfilms. Un bras articulé qui viendrait sélectionner un microfilm en fonction d'une référence, se positionner à un endroit du microfilm en fonction de cette même référence ou d’une seconde. l'avantage c'est qu'il faut des centaines d'années avant de remplir le bureau. Sur la console, il y a aussi des petits boutons et des manettes pour faire la sélection. Pour naviguer à travers le microfilm et en bas de chaque image, il y a une petite référence indiquant où l'on se trouve, et éventuellement un index d'un autre microfilm faisant référence au contenu qui est affiché à l'écran, plus besoin d'y dupliquer du contenu si je peux l'obtenir immédiatement. Si je sélectionne l'indicatif de droite, je vais chercher le document de droite, l'indicatif de gauche, le document de gauche, etc. et je peux revenir en arrière. C'est un petit sélecteur qui se positionne sous les microfilms.

Ça aurait révolutionné la recherche, malheureusement il n'avait ni les moyens ni la technologie pour le construire. Plus besoin de courir à l'autre bout des États-Unis pour récupérer une information. Si quelqu’un la demande, il n'y avait qu'à dupliquer ce morceau de microfilm et c'était fini. Vannevar pensait d’ailleurs qu’une machine analogique aurait plus de chance d’être comprise, et d’être conceptuellement adoptée, qu’une machine n‘étant que pure logique. C’est dans une lettre intitulée As we may think adressée à l’éditeur du Fortune Magazine, qu’il intègre son essai et nomme la machine Memex pour Memory Extender.


Aujourd’hui, je suis chez mon arrière-grand-père. Son copain Patrick est là, il porte une veste longue jusqu'aux chevilles avec des stylos dans la poche, c’est super classe ! En plus, la veste blanche, ça fait chevalier blanc :). Ce jour-là, je crois qu'il était fatigué, il m’a appelé Juan. Je suppose qu'on doit se ressembler. Du coup, j'ai passé une bonne partie de la journée avec Patrick. Il m'a raconté l'époque où il travaillait comme chercheur pour la médecine, spécialisé sur le cerveau.

Dans les années 50, Vannevar est amoureux du concept qu’une machine puisse imiter le cerveau humain. Mais il était tout autant persuadé que des calculs brute-force réalisés par des calculateurs de la taille d’une salle ne mèneraient jamais à une révolution numérique. Sa propre ignorance sur les calculateurs le cloître de plus en plus. Il refuse de s’y intéresser, ne montre plus d’intérêt pour les nouvelles sciences, sur l’esprit et le cerveau. Il délaisse la profession, se satisfaisant de ce qu’il avait déjà produit. Laissant son travail au gré des inspirations futures.

Mon arrière-grand-père décide donc de s’orienter dans la voie abandonnée par Vannevar. Puisqu’il est presque médecin, il effectue des recherches pour comprendre le fonctionnement du cerveau et comment il enregistre le savoir. Les chercheurs ont décelé plusieurs endroits dans le cerveau où les différentes informations sont stockées.

Il y a les informations sur soi, les informations recueillies en tant que souvenirs, et puis les informations sur ce que l'on sait. Un peu comme une encyclopédie. Ça s'appelle la mémoire sémantique. C’est surtout durant les années 1970 que les recherches ont beaucoup progressé. En 1969, accompagné de Collins et Quillian, ils étudient la rapidité de récupération de l’information depuis la mémoire sémantique. Enfin, surtout Collins et Quillian. En 1972, ils étudient l’organisation de la mémoire, ainsi que la manière dont se répand l’activation de la mémoire. Puis en 1973, il étudie avec Rips, Shoben et Smith les distances sémantiques et la vérification des relations sémantiques. Enfin, surtout Rips, Shoben et Smith. Des questions à chaque fois un peu plus profondes, parfois presque philosophiques se posent. Avec Glass, Holyoak et Kiger, ils étudient le rôle des relations antonymes dans le jugement sémantique. Autrement dit, comment le cerveau distingue-t-il un canari, d’une autruche et d’un ventilateur ? Des systèmes TLC (Teachable Language Comprehender) voient le jour. Ce sont des représentations, un sous-ensemble des réseaux sémantiques.

Alors moi, il me parle de sémantique depuis tout à l’heure, et je suis pas bien sûr de ce que c’est, alors j’ai cherché. La sémantique est une branche de la linguistique qui étudie les significations, ce dont on parle, ce que l'on veut transmettre par un énoncé. Le support de la sémantique, la syntaxe, concerne pour sa part le signifiant, sa forme, sa langue, sa graphie, sa grammaire, etc. C'est la forme de l'énoncé. Dans le cadre d’un réseau sémantique, c’est un graphe destiné à la représentation des connaissances. Souvent ce graphe est dirigé et acyclique. Cette forme de graphe sert pour les chemins, la topologie, les emplois du temps, la généalogie, le traitement de données en réseau, la construction de compilateurs informatiques.

Le cerveau stocke l'information comme un graphe acyclique. En tout cas, c'est ce que l’on pense. Partons d'une catégorie, par exemple Animal. Sur ce terme, accrochons-y des feuilles. Chaque feuille représente une information connue à son propos. Par exemple, qu'il possède de la peau, que ça se déplace. Dirigeons nous sur une première branche de cette catégorie sur laquelle se trouvent les oiseaux. De nouveau, sur l’oiseau, nous retrouvons les feuilles qui nous indiquent qu’un oiseau vole et possède des ailes. En poursuivant jusqu’à la prochaine branche, je vais trouver les canaris, dont on sait qu’ils sont jaunes et qu’ils chantent. En partant de l'animal, je peux prendre une autre branche et cette fois-ci tomber sur un poisson qui peut nager et a des nageoires.

Par contre, s'il est facile de penser à un oiseau et à un canari, il est moins facile de penser à une autruche lorsqu’il s’agit d’oiseaux. C'est parce que la branche est plus éloignée et le cerveau humain est doué pour trouver les choses qui sont proches. Il y a autre chose pour laquelle le cerveau est très fort, c'est pour déceler deux choses qui ne sont pas proches. Pour distinguer qu’il n'y a aucun rapport de façon instantanée entre un ventilateur et un oiseau, il rajoute du poids à chaque branche, il leur donne un ordre de grandeur. Plus le chiffre est grand, plus ils sont proches et ressemblants.


Aujourd'hui, le vieux joue à cache-cache lorsque j'arrive. Ce qu’il est mauvais à ce jeu ! Vous savez, un peu comme un enfant dont on voit les pieds qui dépassent du rideau. Il était juste entre son armoire et le mur de l'entrée, je l'ai vite trouvé. On aurait cru qu’il tentait de se fondre dans l’angle. Un de ses copains arrive pour voir si tout va bien, ce n'est pas le même copain qu'hier, mais il porte la même veste. Je dois rentrer.

Il s'est passé quelques semaines avant que je ne le revoie. Mais aujourd'hui, je le vois, alors je suis content.

Dans les années 80, étant presque ingénieur en informatique un jour il rencontre Tim Berners-Lee et ensemble ils ont imaginé (enfin surtout Tim Berners-Lee) un système qui pourrait afficher à l'écran des données et naviguer d'une donnée à une autre exactement comme le ferait le cerveau. Ils ont créé HTTP pour pouvoir envoyer les informations, pas juste sur une machine, mais n'importe quelle machine grâce à Internet et le protocole TCP/IP. Ils ont créé la spécification URL avec Roy Fielding, (enfin, surtout Roy Fielding) pour pouvoir identifier une ressource. Ils ont inventé HTML pour afficher et représenter la ressource afin qu’elle soit mise en page sur un client tel qu’un navigateur. Alors les gens se sont bien entendu accaparé cette invention, C'était révolutionnaire, mais c’est comme un gadget avec une batterie de fonctionnalités, ne pas lire la notice, et se contenter des 3 que l’on a vus dans la publicité à la télévision. Ils leur manquaient le web sémantique, basé sur les réseaux sémantiques.

Reprenons le graphe avec les animaux de tout à l'heure. Le web sémantique va reprendre exactement le même format. Le plus petit élément de ce graphe étant le triplet, composé d’un sujet, d’un prédicat et d’un objet.

Il s'agit de RDF Resource Description Framework. C'est un framework abstrait pour représenter les données exactement comme notre mémoire sémantique le fait.

Pour représenter ce schéma RDF sur une machine, il existe plusieurs formats : turtle, nquad, JsonLD, RDF/PHPn, etc. Et le Web est construit de cette manière.


            {
                "@context": {
                    "ex": "http://example.org/",
                    "schema": "http://schema.org/",
                    "dbr": "http://dbpedia.org/resource/",
                    "xsd": "http://www.w3.org/2001/XMLSchema#",
                    "name":       { "@id": "schema:name" },
                    "birthDate":  { "@id": "schema:birthDate", "@type": "xsd:date" },
                    "birthPlace": { "@id": "schema:birthPlace" },
                    "knows":      { "@id": "schema:knows" }
                },
                "@graph": [
                    {
                        "@id": "ex:alice",
                        "knows": {"@id": "ex:bob" }
                    },
                    {
                        "@id": "ex:bob",
                        "name": "Robert",
                        "knows": {"@id": "ex:carol"},
                        "birthDate": "1980-03-10",
                        "birthPlace": {"@id": "dbr:Oviedo" }
                    },
                    {
                        "@id": "ex:carol",
                        "knows": [{"@id": "ex:alice" }, {"@id": "ex:bob"}],
                        "birthPlace": {"@id": "dbr:Oviedo" }
                    }
                ]
            }
        

Malheureusement, soit les gens l’ont oublié, soit on ne leur a jamais dit.

Il y a beaucoup de recherches qui s'appuient sur cette représentation, elle va beaucoup aider les moteurs de recherche. Pendant des années, Google utilisera ces graphes pour trier, ordonner et peser les informations avant de pouvoir les retourner de façon juste, ou tout du moins d'une manière paraissant naturelle. Récemment, un algorithme et outil nommé Ontologenius, se base sur les mêmes graphes RDF pour nourrir une intelligence artificielle permettant de faire des rapprochements d’idées et de représentations, ou de déterminer qu'il n'y a aucun rapport entre certains éléments. Une sorte de mémoire sémantique munie de jugement artificiel.

Ce qui est intéressant c'est ce qu'il se passe si jamais je scie une branche de l’un de ces graphes. Dans la vraie vie, des choses seront perdues à jamais, et éventuellement dans de rares cas la branche tombe et se rattrape à une autre. L'information s’en trouve un peu mélangée. En 2004, on nommera cet état le déficit de mémoire sémantique. C'est un des principaux effets d'Alzheimer.

Le jour où j'ai compris cela, j’ai pensé à tous ces moments, la veste, les mots qui manquent, le cache-cache, le mauvais nom, et le jour où je n'ai plus entendu d'histoire. Il confondait son histoire et l'Histoire. Les branches ne formaient plus grand-chose à part une pile d'informations désordonnées et discontinues. Mais je ne l’ai vraiment compris que plus tard.

Si je vous raconte tout cela, c'est parce que j'aimerais bien que cette technologie serve vraiment à ce pour quoi elle a été pensée au départ. Partager de la connaissance, étendre notre mémoire. Qui sait ? Il est possible que dans 20 ans, les données et connaissances accumulées par l’être humain soient interfacées avec notre cerveau. Nous pourrons nous concentrer sur notre bien-être, nos passe-temps, les arts, le sport, les amis, et la famille. J'aimerais tellement que l'on mette tout notre savoir et nos connaissances au service de l'être humain plutôt qu’au service du consumérisme. Si nous nous étions investis depuis 20 ans dans cette technologie, chaque jour j'écouterais probablement encore les histoires de mon arrière-grand-père.

Je vous remercie de m’avoir lu.

Si ce texte vous a plu et que vous souhaitez en apprendre davantage sur le protocole HTTP et les API HTTP, Hypermédia, RDF, si souhaitez approfondir vos connaissances sur l'architecture REST, la sécurité, et les bonnes pratiques, vous retrouverez le tout dans mon livre MEMEX, la route du REST.

À bientôt,
Grégoire Hébert.