Intelligence artificielle
L'intelligence artificielle, souvent abrégée avec le sigle IA, est définie par l'un de ses
créateurs, Marvin Lee Minsky, comme « la construction de
programmes informatiques qui s’adonnent à des tâches qui sont, pour l’instant, accomplies de facon plus satisfaisantes par des
êtres humains car elles demandent des processus mentaux de haut niveau tels que : l’apprentissage perceptuel, l’organisation
de la mémoire et le raisonnement critique ».
Une définition difficile
Il existe différentes définitions de l'intelligence artificielle, car :
- L'adjectif artificielle est relativement facile à appréhender : ce type d'intelligence est le résultat d’un
processus humain plutôt que d’un processus naturel biologique et évolutionnaire,
- En revanche, la notion d'intelligence est difficile à
définir :
- La capacite d’acquérir et de retenir les connaissances, d’apprendre ou de comprendre grâce a l’expérience.
- L’utilisation de la faculté de raisonnement pour résoudre des problèmes, et pour répondre rapidement et de manière appropriée
à une nouvelle situation.
- Etc.
Les problèmes soulevés par l'intelligence artificielle concernent des domaines divers comme :
L'intelligence artificielle forte
Le concept d'intelligence artificielle forte désigne le projet de créer une machine capable
non seulement de simuler un comportement intelligent, mais d'éprouver une réelle conscience de soi, de « vrais
sentiments » (quoi qu'on puisse mettre derrière ces mots), et une compréhension de ses propres raisonnements.
L'intelligence artificielle forte a servi de moteur à la discipline, mais a également suscité de nombreux débats. En se
fondant sur le constat que la conscience a un support biologique et donc matériel, la plupart des scientifiques ne voient pas
d'obstacle de principe à créer un jour une intelligence consciente sur un support matériel autre que biologique. En revanche, les
opinions divergent sur la nature de ce support, et la capacité des ordinateurs tels qu'ils sont actuellement conçus à atteindre
cet objectif.
Diversité des opinions
Les principales opinions pour répondre à la question d'une intelligence artificielle consciente soutenues sont les
suivantes :
- Impossible : la conscience serait le propre des organismes vivants, et elle serait liée à la nature des
systèmes biologiques. Cette position est défendue principalement par des philosophes et des religieux.
- Problème : Elle rappelle toutefois toutes les controverses passées entre vitalistes et matérialistes, qui ont à plusieurs
reprises démenti les positions des premiers.
- Impossible avec des machines manipulant des symboles comme les ordinateurs actuels, mais
possible avec des systèmes matériels dont l'organisation mimerait le fonctionnement du cerveau humain (comme des
neurones artificiels).
- Problème : Le système en question répondant exactement de la même façon que sa simulation sur ordinateur -
toujours possible - au nom de quel principe leur assigner une différence ? (Thèse CPC de Bruno Marchal )
- Impossible avec les ordinateurs classiques manipulant des symboles, mais
possible avec des réseaux de neurones formels.
- Problème : le même que pour le point précédent.
- Possible avec des ordinateurs manipulant des symboles. Cette dernière opinion constitue la position la plus
engagée en faveur de l'intelligence artificielle forte.
- Problème : ce que fait un ordinateur, un système à base d'échanges de bouts de papier dans une salle immense
peut le simuler quelques milliards de fois plus lentement. Or il reste difficile d'admettre que cet échange de bouts de papiers
« ait une conscience ». Voir Chambre chinoise.
Il nous manque apparement encore quelques paradigmes pour sortir de ces
impasses.
Des auteurs comme Hofstadter (mais déjà avant lui Arthur C.
Clarke ou Alan Turing) expriment par ailleurs un doute sur la possibilité
de faire la différence entre une intelligence artificielle qui éprouverait réellement une conscience, et une autre qui simulerait
exactement ce comportement. Après tout, nous ne pouvons même pas être certains que d'autres consciences que la nôtre (chez des
humains s'entend) éprouvent réellement quoi que ce soit. On retrouve là le problème connu du solipsisme en philosophie.
Travaux complémentaires
- Le mathématicien de la physique Roger Penrose pense que la conscience
viendrait de l'exploitation de phénomènes quantiques
dans le cerveau (voir microtubules), empêchant la simulation réaliste de plus
de quelques dizaines de neurones sur un ordinateur normal, d'où les résultats encore très partiels de l'IA. Il restait jusqu'à
présent isolé sur cette question; un autre chercheur a présenté depuis une thèse de même esprit quoi que moins
radicale :
Si cette spéculation se révélait juste (ce qui est loin d'être assuré), le modèle du neurone formel serait alors très incomplet.
- Une autre attaque contre la réduction de la pensée aux neurones formels est lié au rôle apparemment plus important que prévu
des cellules gliales, qui remettent en cause le modèle dit du
tout-neuronal.
Cela dit, l'intelligence artificielle est loin de se limiter aux seuls réseaux de neurones, qui n'y sont utilisé que comme classifieurs, et parmi d'autres classifieurs dont certains au contraire algorithmiques donnent des résultats voisins.
L'intelligence artificielle faible
La notion d'intelligence artificielle faible constitue une approche pragmatique d'ingénieur : chercher à construire des systèmes de plus en plus autonomes (pour réduire le coûts de leur
supervision), des algorithmes capables résoudre des problèmes d'une certaine classe, etc. Mais, cette fois, la machine semble
agir comme si elle était intelligente.
C'est principalement sur base de cette hypothèse que la plupart des techniques actuelles d'intelligence artificielle sont
utilisées. C'est par exemple la démarche utilisée par IBM dans son projet nommé Autonomic computing.
Simple évolution, donc, et non révolution : l'intelligence artificielle s'inscrit à ce compte dans la droite succession
de ce qu'ont été la recherche opérationnelle
dans les années 1960, le process control dans les années 1970, l'aide à la décision
dans les années 1980 et le data mining dans les années 1990. Et, qui plus est,
avec une certaine continuité.
Les courants de pensée
La cybernétique naissante des années quarante revendiquait très
clairement son caractère pluridisciplinaire et se nourrissait des contributions les plus diverses : neurophysiologie, psychologie, logique, sciences sociales… Et c'est
tout naturellement qu'elle envisagea deux approches des systèmes, deux approches reprises par les sciences cognitives et de ce
fait l'intelligence artificielle :
- une approche par la décomposition (du haut vers le bas),
- une approche de construction globaliste ou systémique (du bas
vers le haut).
Ces deux approches, plutôt complémentaires que contradictoires, sont respectivement à la base des hypothèses de travail que
constituent le cognitivisme et le connexionisme.
Le cognitivisme
Le cognitivisme considère que le vivant, tel un ordinateur (bien que par des procédés évidemment très
différents), manipule essentiellement des symboles élémentaires. Dans son livre Les sociétés de l'esprit, Marvin Minsky, s'appuyant sur des observations du pédagogue Jean Piaget envisage le processus cognitif comme une compétition d'agents fournissant
des réponses partielles et dont les avis sont arbitrés par d'autres agents. Il cite les exemples suivants de Piaget :
- L'enfant croit d'abord que plus le niveau d'eau est élevé dans un verre, plus il y a d'eau dans ce verre. Après avoir joué
avec des transvasements successifs, il intègre le fait que la notion de hauteur du liquide dans le verre entre en compétition
avec celle du diamètre du verre, et arbitre de son mieux entre les deux.
- Il vit ensuite une expérience analogue en manipulant de la pâte à modeler : la réduction de plusieurs objets
temporairement représentés à une même boule de pâte l'incite à dégager un concept de conservation de la quantité de
matière.
Au bout du compte, ces jeux d'enfants se révèlent essentiels à la formation de l'esprit, qui dégage quelques règles
pour arbitrer les différents éléments d'appréciation qu'il rencontre, par essais et erreurs.
Le connexionnisme
Le connexionnisme, se
référant aux processus auto-organisationnels, envisage la
cognition comme le résultat d'une interaction globale des parties élémentaires d'un système. On ne peut pas nier qu'un chien ait
une sorte de connaissance des équations différentielles du mouvement, puisqu'il arrive à attraper un bâton au vol. Et
pas davantage qu'un chat ait aussi une sorte de connaissance de la loi de chute des corps, puisqu'il se comporte comme
s'il savait à partir de quelle hauteur il doit plus essayer de sauter directement pour se diriger vers le sol. Cette faculté qui
évoque un peu l'intuition des philosophes se caractériserait par la prise en
compte et la consolidation d'éléments perceptifs dont aucun pris isolément
n'atteint le seuil de la conscience, ou en tout cas n'y déclenche d'interprétation particulière..
Domaines d'application de l'intelligence artificielle
On peut envisager de demander les services suivants, ensemble ou séparément, à un dispositif d'intelligence
artificielle :
- Interface vocale : se faire comprendre en lui parlant,
- Assistance par des machines dans les tâches dangereuses, ou demandant une grande précision,
- Aide aux diagnostics médicaux (bien qu'un tensiomètre, qui remplit cette fonction, ne soit considéré par personne comme une
application de l'intelligence artificielle),
- Résolution de problèmes complexes, sous réserve de quantifier ce mot
- Traduction automatique, si possible en temps réel ou très légèrement différé, comme dans le film « Dune ».
- Intégration automatique d'informations provenant de sources hétérogènes,
- Etc.
En l'état, les réalisations actuelles de l'intelligence artificielle peuvent être regoupées en différents domaines, tels
que:
Au fil du temps, certains langages de
programmation se sont avérés plus commodes que d'autres pour écrire des applications d'intelligence artificielle. Parmi
ceux-ci, Lisp et Prolog furent sans doute les
plus médiatisés. Slip constituait une solution
ingénieuse pour faire de l'intelligence artificielle en FORTRAN. Eliza (le premier chatterbox, donc pas de la
« véritable » intelligence artificielle) tenait en trois pages de SNOBOL.
On utilise aussi, plus pour des raisons de disponibilité et de performance que de commodité, des langages classiques tels que
C ou C++. Lisp au eu pour sa part une série de successeurs plus ou moins inspirés de lui, dont le langage
Scheme.
Des programmes de démonstration de théorèmes géométriques simples ont existé dès les années 1960; et des logiciels aussi triviaux que Maple et Mathematica effectuent aujourd'hui des travaux d' intégration symbolique qui
il y a trente ans encore était du ressort d'un étudiant de mathématiques supérieures. Mais ces programmes ne
savent pas plus qu'ils effectuent des démonstrations géométriques ou algébriques que Deep Blue ne savait qu'il jouait aux échecs (ou un programme de facturation qu'il calcule une facture. Ces cas
représentent donc plus des opérations intellectuelles assistées par ordinateur que de l' intelligence
artificielle à proprement parler.
Dans l'informatique ludique (les jeux vidéo), l'Intelligence
Artificielle (IA) se développe. En effet les nouvelles générations de cartes vidéo traitent un grand nombre d'opérations
auparavant dévolues au processeur. Le processeur est donc moins sollicité pour
l'affichage et les programmeurs peuvent utiliser sa puissance pour développer des systèmes d'IA plus perfectionnés.
L'intelligence artificielle a connu un essor important pendant les années
1960 et 70, mais à la suite de résultats décevants par rapport aux
budgets investis, son succès s'estompa dès le milieu des années
1980.
D'après certains auteurs, les perspectives de l'intelligence artificielle pourraient avoir des inconvénients, si par exemple
les machines devenaient plus intelligentes que les humains, et finissaient par les dominer, voire (pour les plus pessimistes) les
exterminer, de la même façon que nous cherchons à exterminer certaines séquences d'ARN (les virus) alors que c'est bien de l'ARN
qui nous a construits. On reconnaît bien entendu le thème du film Terminator, mais des directeurs de société techniquement très compétents, comme Bill Joy de la société Sun, affirment considérer le risque comme réel à
long terme.
Toutes ces possibilités futures ont fait l'objet de quantités de romans de science fiction, tels ceux d'Isaac Asimov ou William Gibson en passant par Arthur C. Clarke.
Précurseurs de l'intelligence artificielle
Si les progrès de l'intelligence artificielle sont récents, ce thème de réflexion est tout à fait ancien, et il est apparaît
régulièrement au cours de l'histoire. Les premiers signes d'intérêt pour une intelligence artificielle et les principaux
précurseurs de cette discipline sont les suivants.
- La plus ancienne trace du thème de « l'homme dans la machine » date de 800 avant notre ère, en Égypte. La statue du dieu Amon levait le bras pour
désigner le nouveau pharaon parmi les prétendants qui défilaient devant lui, puis
elle « prononçait » un discours de consécration. Les égyptiens étaient probablement conscients de la présence d'un
prêtre actionnant un mécanisme et déclarant les paroles sacrées derrière la statue, mais cela ne semblait pas être pour eux
contradictoire avec l'incarnation de la divinité.
- Homère, dans l'Iliade (XVIII, 370–421), décrit les automates réalisés par le dieu forgeron Héphaïstos : des trépieds munis de roues en or, capables de porter des
objets jusqu'à l'Olympe et de revenir seuls dans la demeure du dieu ; ou encore,
deux servantes forgées en or qui l'assistent dans sa tâche. De même, le Géant de bronze Talos, gardien des rivages de la Crète, était considéré comme une œuvre
du dieu.
- Vitruve, architecte romain, décrit l'existence entre le IIIe et
le Ier siècle avant notre ère, d'une école d'ingénieurs fondée par Ctesibius à Alexandrie, et concevant des mécanismes destinés à l'amusement tels des corbeaux qui chantaient.
- Héron
l'ancien décrit dans son traité « Automates », un carrousel animé grâce à la vapeur et considéré comme
anticipant les machines à vapeur.
- Roger Bacon aurait conçu des automates doués de la
parole.
- Gio
Battista Aleotti et Salomon de Caus ont
construit des oiseaux artificiels et chantants, des flûtistes mécaniques, des nymphes, des dragons et des satyres animés pour
égayer des fêtes aristocratiques, des jardins et des grottes.
- René Descartes a conçu en 1649 un automate
qu'il appelait « ma fille Francine ». Il conduit par ailleurs une réflexion d'un modernisme étonnant sur les
différences entre la nature des automates, et celles d'une part des animaux (pas de
différence) et d'autre part celle des hommes (pas d'assimilation). Ces analyses en font le précurseur méconnu d'un des principaux
thèmes de la science-fiction : la confusion entre le vivant et
l'artificiel, entre les hommes et les robots, les androïdes ou les intelligences artificielles.
- Jacques de Vaucanson a construit en
1738 un « canard artificiel de cuivre doré, qui boit, mange, cancane, barbote et
digère comme un vrai canard ». Il était possible de programmer les mouvements de
cet automate, grâce à des pignons placés sur un cylindre gravé, qui contrôlaient des baguettes traversant les pattes du canard. L'automate a été exposé pendant plusieurs années en France, en Italie et en Angleterre,
et la transparence de l'abdomen permettait d'observer le mécanisme interne. Le dispositif permettant de simuler la digestion et
d'expulser une sorte de bouillie verte fait l'objet d'une controverse. Certains commentateurs estiment que cette bouillie verte
n'était pas fabriquée à partir des aliments ingérés, mais préparée à l'avance. D'autres estiment que cet avis n'est fondé que sur
des imitations du canard de Vaucanson. Malheureusement, l'incendit du Musée de Nijninovgorod en Russie vers 1879 détruisit cet
automate.
- Les artisans Pierre et Louis Jaquet-Droz fabriquèrent parmi les meilleurs automates fondés sur un système purement mécanique, avant le développement des dispositifs
électromécaniques.
Pensée automatique
Les processus cognitifs peuvent-ils se réduire à un simple calcul ? Et si tel
est le cas, quels sont les symboles et les règles à employer ?
Les premiers essais de formalisation de la pensée sont les suivants :
- Raymond Lulle, missionnaire, philosophe, et
théologien espagnol du XIIIe siècle, a fait la première tentative pour
engendrer des idées par un système mécanique. Il combinait aléatoirement des concepts grâce à une sorte de règle à calcul, un zairja, sur laquelle pivotait des disques
concentriques gravés de lettres et de symboles philosophiques. Il baptisa sa méthode Grand Art (Ars Magna), fondée sur
l'identification de concepts de base, puis leur combinaison mécanique soit entre eux, soit avec des idées connexes. Raymond Lule
appliqua sa méthode à la métaphysique, puis à la morale, à la médecine et à l'astrologie. Mais il n'utilisait que la logique déductive, ce qui ne permettait
pas à son système d'acquérir un apprentissage.
- Gottfried Wilhelm
Leibnitz, au XVIIe siècle, a imaginé un calcul pensant (calculus rationator), en assignant un nombre à chaque concept. La manipulation de ces nombres aurait permis de
résoudre les questions les plus difficiles, et même d'aboutir à un langage universel. Leibnitz a toutefois démontré que l'une des principales
difficultés de cette méthode, également rencontrée dans les travaux modernes sur l'intelligence artificielle, est
l'interconnexion de tous les concepts, ce qui ne permet pas d'isoler une idée de toutes les autres pour simplifier les problèmes
liés à la pensée.
- George Boole a inventé la formulation mathématique des
processus fondamentaux du raisonnement, connues sous le nom d'algèbre de Boole. Il était conscient des liens de ses travaux avec les mécanismes de l'intelligence, comme
le montre le titre de son principal ouvrage paru en 1854 : « Les lois de la pensée » (The laws of
thought), sur l'algèbre booléenne.
- Gottlob Frege perfectionna le système de Boole en inventant le concept de prédicat, qui est une entité logique soit
vraie, soit fausse (toute maison a un propriétaire), mais contenant des variables non logiques, n'ayant en soit aucun degré de
vérité (maison, propriétaire). Cette invention eu une grande importance puisqu'elle permis de démontrer des théorèmes généraux,
simplement en appliquant des règles typographiques à des ensembles de symboles. La réflexion en langage courant ne portait plus
que sur le choix des règles à appliquer. Par ailleurs, seul l'utilisateur connaît le sens des symboles qu'il a inventé, ce qui
ramène au problème de la signification en intelligence artificielle, et de la subjectivité des utilisateurs.
- Bertrand Russell et Alfred North Whitehead publièrent au début du XXe siècle un ouvrage intitulé « Principia mathematica », dans
lequel ils résolvent des contradictions internes à la théorie de Gottlob Fredge. Ces travaux laissaient espérer d'aboutir à une formalisation complète des
mathématiques.
- Kurt Gödel démontre au contraire que les
mathématiques resteront une construction ouverte, en publiant en 1931 un article intitulé « Des propositions
formellement indécidables contenues dans les Principia mathematica et autres systèmes similaires ». Sa démonstration
est qu'à partir d'une certaine complexité d'un système, on peut y créer plus de propositions logiques qu'on ne peut en démontrer
vraies ou fausses. L'arithmétique, par exemple, ne peut trancher par ses axiomes si on doit accepter des nombres dont la carré
soit -1. Ce choix reste arbitraire et n'est en rien lié aux axiomes de base. Le travail de Gödel suggère qu'on pourra
créer ainsi un nombre arbitraire de nouveaux axiomes, compatibles avec les précédents, au fur et à mesure qu'on en aura besoin.
IL est a noter que si l'arithmétique est démontrée incomplète, le calcul des prédicats (logique formelle) est
au contraire démontré par Turing comme complet.
- Alan Turing parvient aux mêmes
conclusions que Kurt Gödel, en inventant des machines abstraites et
universelles (rebaptisées les machines de Turing), dont les ordinateurs modernes sont considérés comme des concrétisations. Il
démontre l'existence de calculs anodins qu'aucune machine ne peut faire, sans pour autant que cela constitue pour Turing un motif
pour douter de la faisabilité de machines pensantes.
- Irving John Good , Myron Tribus et E.T. Jaynes ont décrit de façon
très claire les principes assez simples d'un robot à logique inductive utilisant les principes de l'inférence bayésienne pour enrichir sa base de
connaissances sur la base du Théorème de
Cox-Jaynes. Ils n'ont malheureusement pas traité la question de la façon dont on pourrait stocker ses connaissances sans que
le mode de stockage entraîne un biais cognitif. Le projet est voisin de celui de Raymond Lulle, mais fondé dette fois-ci sur une logique inductive, et donc
propre à résoudre quelques problèmes ouverts.
- Des chercheurs comme Alonzo Church ont posé des limites pratiques aux
ambitions de la raison, en orientant la recherche (Herbert Simon,
Michael Rabin, Stephen Cook) vers l'obtention des
solutions en temps fini, ou avec des ressources limitées, ainsi que vers la catégorisation des problèmes selon des classes de
difficulté (en rapport avec les travaux de Cantor sur l'infini).
Principaux projets et réalisations de l'intelligence artificielle
La liste ci-dessous indique les projets et les réalisations marquants dans le domaine de l'intelligence artificielle. La
quasi-totalité de ces travaux ont été accomplis aux États-Unis, et il est à noter qu'une bonne part d'entre eux ont été financés
par l'armée américaine. L'un des principaux financeurs de ces travaux fut la DARPA (Defense Advanced Rechearch Project Agency),
célèbre pour avoir initié le réseau Arpanet, qui a donné naissance à Internet.
- Logic Theorist (Théoricien de la logique) (1956) - Ce programme informatique est considéré comme le premier
relevant de l'intelligence artificielle. Il a été développé par Allen Newell et Herbert Simon, avec
l'assistance de Cliff Shaw. Logic
Theorist est un programme de démonstration de théorèmes, fondé sur une recherche sélective. Une hypothèse de base donnée, peut
subir toute une gamme de manipulations élémentaires conformes aux lois de la logique. Le résultat obtenu peut passer à son tour
par une série de manipulations. La répétition de cette procédure crée une structure arborescente, sous forme « d'arbre de
recherche ». L'exploration de celui-ci permet d'aboutir au résultat recherché, après un nombre indéfini d'opérations. Le
problème à surmonter est de trouver le chemin qui mène de l'hypothèse de base au résultat recherché. Logic Theorist comportait
une liste de règles empiriques appropriées, les heuristiques, qui
permettaient de sélectionner laquelle des branches de l'arbre de recherche était la plus susceptible de mener au but. Une fois
programmé sur une machine de la RAND, Logic Theorist démontra 38 des 52 premiers théorèmes du 2e chapitre des « Principia mathematica » de Bertrand Russell et Alfred North Whitehead. Le théorème 2.85
faisait même l'objet d'une démonstration plus élégante que celle des
auteurs, au grand contentement de Russel. Pour marquer la portée de ce dernier résultat, Allen Newell et Herbert Simon décidèrent de publier cette démonstration dans le « Journal of
symbolic logic », en faisant co-signer cette publication par Logic Theorist. Lors de la conférence de Dartmouth de 1956,
considérée comme la rencontre fondatrice de l'intelligence artificielle en tant que discipline scientifique, Logic Theorist fut
le seul programme opérationnel présenté. Il est par ailleurs considéré comme le lointain précurseur des logiciels de traitement
formel des équations.
- IPL (Information Processing Language ou langage de traitement de l'information) (1956) - Dans le cadre de la
réalisation de Logic Theorist, le résultat le plus important pour le développement de l'intelligence artificielle, a été
l'invention d'un langage de programmation spécifique nommé IPL. Ce langage fut le premier à employer la technique de
programmation dite de traitement des listes. Les auteurs de Logic Theorist pensaient que les langages existant à l'époque, comme
le FORTRAN, n'étaient pas appropriés pour un tel projet. En effet, ceux-ci exigeaient
que les ensembles de nombres et de symboles manipulés soient définis au préalable. Au contraire, les auteurs de Logic Theorist
estimaient que la pensée est fondée d'une part sur la création, la modification et la destruction de structures de symboles en
interaction, et d'autre part sur le caractère associatif de la mémoire humaine. La technique de traitement de liste est une
tentative pour bénéficier de ces deux caractéristiques. Les idées d'Allen Newell et de Herbert Simon
inspirèrent John McCarthy lorsque celui-ci inventa son propre langage
d'IA : le LISP.
- Global Problem Solver ou GPS (Système général de résolution de problèmes) (1957) - Partant du constat que
les humains ne raisonnent pas comme Logic Theorist, Allen Newell et Herbert Simon s'inspirèrent
d'expériences de psychologie sur les méthodes de résolution de problèmes par
des humains, pour créer GPS. Celui-ci avait l'originalité d'être fondé sur une organisation et un ensemble de règles heuristiques ne renfermant aucune référence à une tâche particulière, d'où le
qualificatif de Système général de résolution de problèmes. GPS employait l'analyse fins/moyens, qui fonctionnait comme un
principe de rétroaction, détectant puis réduisant les différences entre
un état de faits et le but recherché. Cette méthode de résolution était couplée à la capacité à décomposer un problème en
plusieurs sous-problèmes. GPS fut employé pour résoudre des casse-têtes, des intégrations symboliques, et des décryptages de
codes secrets.
- Sad Sam (1957) - Créé par Robert K. Lindsay, Sad Sam provient de l'étude de l'apprentissage verbal. Ce
programme était capable de définir des liens de parenté entre des personnes citées dans des phrases formulées en langage courant,
en construisant peu à peu l'équivalent d'un arbre généalogique interne. Sad Sam était donc capable de relier une nouvelle
information à d'autres faits déjà enregistrés, pour en tirer des conclusions qui n'avaient pas été apprises. À ce titre, certains
chercheurs ont estimé que Sad Sam présentait les premières ébauches de compréhension au sens humain du terme.
- LISP (LISt Processing ou traitement de listes) (1958) - En s'inspirant du langage IPL, John McCarthy inventa au MIT le LISP, qui devint le langage universel de l'IA. En effet, les qualités du LISP en matière de gestion
de mémoire et de représentation lui permirent de supplanter ses concurrents comme l'IPL ou le COMIT. Toutefois, dans les
conditions de l'informatique des années 1960, où la taille des mémoires était faible, l'encombrement en espace mémoire des
langages de traitements de listes a freiné leur adoption. De plus, le LISP était interprété et non compilé, puisqu'il pouvait
ainsi se modifier lui-même, ce qui entrainaît une grande lenteur d'exécution. Le LISP ne devint attractif qu'à partir de
1970.
- Perceptron (1958) - Le Perceptron fut le premier modèle opérationnel de réseau de neurones. Il fut créé par Frank Rosenblatt sous forme d'une
simulation tournant sur un IBM 704, à partir des travaux de McCulloch et Pitts sur la notion de neurones formels interconnectés en 1943, et de Hebb sur
l'importance du couplage synaptique dans les processus d'apprentissage en 1949. Le Perceptron est inspiré du système visuel, et
il se montre capable d'apprentissage en modifiant ses connections synaptiques. Le Perceptron comprend trois éléments
principaux :
- une couche d'unités sensorielles, ou « rétine », fournissant des
réponses modulées en fonction de l'intensité du stimulus,
- une couche de cellules d'association, constituant la couche de neurones formels proprement dits, selon la définition de
McCulloch et Pitts.
- une couche de cellules de décisions, qui représentent la réponse de sortie du Perceptron.
- Grâce à une procédure inventée par Frank Rosenblatt, l'apprentissage du Perceptron se fait par correction d'erreur, en
modifiant les coefficients de poids des signaux entre les cellules. En 1969, Marvin Lee Minsky et Seymour Papert publièrent un ouvrage intitulé Perceptrons, qui démontrait certaines limitations de
ces modèles. En particulier, le Perceptron ne peut pas effectuer l'opération binaire de parité (OU exclusif ou XOR). L'autorité de ces auteurs, ainsi que le décès
accidentel de Frank Rosenblatt, entraîna un quasi-arrêt des recherches dans ce domaine pendant près de 15 ans, jusqu'à
l'apparition des réseaux multicouches de
neurones.
Les demandes d'identification, renforcée par le terrorisme, assurent un
marché immense à cette technique.
- Geometry Theorem Prover ou GTP (Système de démonstration de théorèmes géométriques) (1959) - Ce programme a
été financé par IBM et conçu par Herbert Gelernter. GTP fonctionnait de manière rétrograde à
partir du théorème à démontrer, pour remonter par des raisonnements
intermédiaires à des théorèmes ou des axiomes connus. Lors de cette phase, le programme s'aidait d'une figure géométrique décrite à partir des coordonnées
de ses points. Pour élaguer l'arbre de recherche, GTP cherchait uniquement à démontrer les propriétés qui semblaient vérifiées
sur le schéma, comme le font inconsciemment les humains. GTP était ainsi capable de faire des démonstrations nécessitant jusqu'à
10 étapes. Plus important, il fut le premier programme capable de faire référence à un modèle, dans la mesure où la figure géométrique était utilisée comme une représentation interne. À la suite de la
notoriété de GTP et d'autres programmes d'IA, IBM décida d'arrêter ces études d'une part en
raison de la pression des actionnaires qui n'aimaient pas ces dépenses non
génératrices de dividendes immédiats (les actionnaires sont en général âgés), et d'autre part du service marketing, qui s'alarmait d'une image trop inquiétante des ordinateurs dans l'esprit du
grand public.
- GTP garde une belle relique à son actif : il découvrit la première démonstration géométrique considérée comme plus
élégante que celles des manuels scolaires de son époque. Au problème « Dans un triangle, l'angle B est égal à l'angle
C. Démontrez que le côté AB est égal au côté BC », il apporta une démonstration non pas en considérant les deux
sous-triangles découpés par la hauteur, comme on le supposait, mais par un : « Considérons les triangles ABC et
ACB : ces deux triangles sont semblables et possèdent des côtés correspondants BC et CB égaux. Ils sont donc égaux
et AB est en conséquence égal à BC ». Contre-intuitif, sans doute, mais inattaquable !
- SAINT (Symbolic Automatic INTegrator ou intégrateur symbolique automatique) (1961) - James Slagle appliqua
la méthodologie de Logic Theorist au domaine de l'intégration symbolique, en
la transposant ainsi de la logique à l'algèbre, grâce à la mise au point de procédures d'exploration des arbres ET/OU. Confronté à des sujets d'examens
posés aux étudiants du MIT de 1re année, SAINT parvint à résoudre 84 problèmes sur
86. Ce programme a été perfectionné par Joel Moses en 1966 sous le nom de SIN (Symbolic INtégration), avant de
donner naissance en 1969 à MACSYMA, qui a inspiré nombre de logiciels de traitement formel des équations
aujourd'hui employés (dont un descendant en ligne droite toujours en développement : MAXIMA).
- ANALOGY (1963) - Tom Evans a créé ce programme en se fondant sur l'idée que le cerveau humain, devant une
situation donnée, ne raisonne pas selon les voies de la logique, mais en essayant de trouver des ressemblances avec des problèmes
déjà rencontrés. Il a tenté de simuler l'aptitude à chercher des ressemblances avec ce logiciel capable de trouver des analogies
entre des figures géométriques employées dans les tests d'intelligence.
- STUDENT (1964) - Daniel Bobrow a inventé ce programme, capable de faire une analyse syntaxique de textes
simples, pour résoudre des problèmes algébriques du type « trouvez l'âge du capitaine ».
- SIR (Semantic Information Retrieval ou recherche d'information sémantique) (1964) - Ce programme de Bertram
Raphael pouvait interpréter des dialogues simples, en cherchant des analogies avec des modèles de phrases. Cette technique lui
permettait de déduire des relations entre les personnes ou les objet cités dans ces phrases, en posant des questions à un
opérateur. Toutefois, les capacités de SIR, comme celles de STUDENT étaient très limitées. Les informations traitées concernaient
un domaine très restreint, et les programmes butaient rapidement sur des ambiguïtés.
- Shakey (1969) - Créé dans le laboratoire du Stanford Rechearch Institute, Shakey fut le premier robot ayant
fait l'objet de publicité dans le grand public, à la suite d'un reportage très sensationnaliste de la revue Life, qui
l'avait baptisé la première personne électronique. Shakey était également censé pouvoir circuler sur la lune pendant
plusieurs mois sans recevoir une seule directive de la terre ! Shakey était un cube monté sur roues, équipé d'un bras,
d'une caméra vidéo, d'un télémètre et d'antennes de liaison radio. Il se déplaçait dans un micromonde constitué de 7 pièces
reliées par 8 portes, contenant des boites carrées. Celles-ci étaient contournées, déplacées ou empilées en fonction des
instructions que le robot recevait par un clavier. Shakey avait une procédure de contrôle nommée STRIPS, qui était un
perfectionnement du General problem Solver, et qui constituait sa principale innovation. Le projet Shakey avait pour objectif de
créer un robot capable d'enchaîner une série d'actions : circuler dans une pièce pour trouver un bloc, le déplacer au sommet
d'une plate-forme après avoir poussé un plan incliné contre elle, et ainsi de suite. En fait, Shakey devint seulement capable de
réaliser ces actions de façon indépendante, avec une forte probabilité d'échec. Constatant que les objectifs du projet étaient
hors de portée, la DARPA mit fin au financement de ces travaux.
- PLANNER (1969) - Ce langage de programmation fut inventé par Carl Hewitt à partir de LISP, selon une approche antagoniste du GPS et de ses méthodes de résolution de problèmes fondées sur la logique
et les procédures uniformes de démonstration de théorèmes. PLANNER permettait en quelques instructions de fixer des buts à un
programme (chercher un cube rouge placé sous une pyramide), des plans et des assertions de façon automatique, sans avoir besoin
de programmer des itérations et des marches arrière comme avec LISP. Mais PLANNER
présentait l'inconvénient de ne pas faire de distinction entre les connaissances contenues dans ces procédures, et l'exploitation
de ces connaissances par ces mêmes procédures. Les programmes étaient donc un mélange inextricable de connaissances et de
procédures. Ce manque de structuration a été critiqué et a conduit à l'abandon des langages de type PLANNER. Marvin Lee Minsky estime toutefois que l'intelligence naturelle est organisée
selon des principes similaires à PLANNER, avec des agents indépendants hiérarchisés, selon sa théorie de la société de
l'esprit.
- SHRDLU et les micro-mondes (1969) - Le nom de SHRDLU est devenu un mythe de l'intelligence artificielle.
Programmé avec le langage PLANNER, ce logiciel était la modélisation d'un micro-monde de blocs et de pyramides de couleurs
diverses, avec une boite pour les ranger. Un bras virtuel permettait à un utilisateur de manipuler ces objets. L'opérateur
pouvait donner des ordres et poser des questions, alors que SHRDLU répondait en décrivant l'emplacement des objets, et les motifs
des manipulations effectuées. SHRDLU affichait également sur un écran une image de son micro-monde. Terry Winograd avait nommé son
programme en référence au magazine MAD, qui l'employait pour désigner des monstres (et non
par référence aux lettres les plus employées en anglais, comme cela est parfois indiqué). Le fait que l'utilisateur et SHRDLU
échangeaient des informations constructives, et que ce dernier pouvait expliciter ses motivations, fit une forte impression. Les
partisans des micro-mondes espéraient pouvoir enrichir et complexifier progressivement les mondes simulés pour les rapprocher de
la réalité, ou bien fusionner plusieurs micro-mondes pour les étendre. Cette approche fut un échec, car il est vite apparu qu'il
n'est pas possible d'aller vers un monde plus proche du réel sans prise en compte du sens commun dans le programme.
Eugène Charniak prit pour exemple en 1972 le cas d'une tirelire-cochonnet pour enfants. Un programme de type micro-monde ne peut
pas se contenter d'une définition tirée d'un dictionnaire. Il faut avoir une description de la taille, de la forme, des couleurs
et du poids de l'objet, tout en sachant que ces paramètres peuvent fortement varier. La notion d'argent implique de définir ce
que sont l'économie et l'épargne. L'utilisation de cet objet simple se révèle complexe à décrire : mettre de l'argent,
secouer le cochonnet pour en interpréter le bruit, retirer l'argent en mettant le cochonnet à l'envers et en employant un
couteau, voire utiliser le cochonnet comme une figurine animée. La complexité du savoir à mettre en œuvre est très éloignée de la
simplification propre aux micro-mondes.
- PROLOG (1977). Le langage « Programming in logic » est un moteur d'inférence conçu par
A.Colmerauer et P.Roussel pour l'interprétation du langage naturel, mais il est très fréquemment utilisé pour tout type de
problème en l'intelligence artificielle. Prolog est un langage déclaratif, cela signifie que d'être consitué de la solution à un
problème, un programme consiste en une base de faits d'une part, et d'une liste de relations logiques d'autre part. Pour exécuter
le programme, il faut poser une question, et Prolog donne la réponse basée sur les faits et déduite des règles.
Prolog s'adaptait si bien à la réalisation d'applications de combinatoire telles que nécessitées par les agences de voyage,
par exemple, qu'il fit dire à Philippe Kahn : « Qu'on ne parle
plus désormais d'intelligence artificielle! C'était un nom du passé pour un domaine de recherche. Nous sommes aujourd'hui à
l'époque des réalisations, et on va réaliser maintenant des applications professionnelles programmées en PROLOG comme on en
programmait hier en COBOL ». l'avenir lui donna tort sur le court terme.
Espoirs et méfiances liées à l'intelligence artificielle
Une description spectaculaire d'un possible avenir de l'intelligence artificielle a été faite par le professeur I. J. Good :
« Supposons qu'existe une machine surpassant en intelligence tout ce dont est capable un homme, aussi brillant soit-il.
La conception de telles machines faisant partie des activités intellectuelles, cette machine pourrait à son tour créer des
machines meilleures qu'elle-même; cela aurait sans nul doute pour effet une réaction en chaîne de développement de
l'intelligence, pendant que l'intelligence humaine resterait presque sur place. Il en résulte que la machine ultraintelligente
sera la dernière invention que l'homme aura besoin de faire, à condition que ladite machine soit assez docile
pour constamment lui obéir. »
La situation en question, correspondant à un changement qualitatif du principe même de progrès, a été nommée par
quelques auteurs « La Singularité » .
Good estimait à un peu plus d'une chance sur deux la mise au point d'une telle machine avant la fin du XXe siècle. La prédiction, en 2004, ne s'est pas
(encore?) réalisée, mais avait imprégné le public : le cours de l'action IBM quadrupla
(bien que les dividendes trimestriels versés restassent à très peu de chose près les mêmes) dans les mois qui suivirent la
victoire de Deep Blue sur Gary Kasparov. Une large partie du grand public était en effet persuadée qu'IBM venait de mettre au point le
vecteur d'une telle explosion de l'intelligence et que cette compagnie en tirerait profit. L'espoir fut bien entendu
déçu : une fois sa victoire acquise, Deep Blue (incapable d'ailleurs de jouer à autre chose qu'aux échecs, et ne sachant
même pas qu'il jouait aux échecs) fut reconverti en machine classique utilisée pour le data mining. Nous sommes probablement encore très loin d'une machine possédant ce que nous nommons de
l'intelligence générale, et tout autant d'une machine possédant la base de connaissances de n'importe quel
chercheur, si humble soit-il.
Principales techniques liées à l'intelligence artificielle
Spécialistes de l'intelligence artificielle
- Irving John Good
- Douglas Lenat ;
- Marvin Lee Minsky
- Seymour Papert
- Pour l'anecdote, citons Daniel Goossens, chercheur à l'Université
Paris 8 mais aussi auteur de bandes-dessinées de premier plan.
Voir aussi
Liens externes
L'intelligence artificielle au cinéma
- Colossus : the Forbin project 1969, d'après le roman de Dennis Feltham
Jones de 1967 (un système d'IA militaire étatsunien contacte son homologue russe pour
qu'ils coopèrent à leur mission commune (éviter la guerre nucléaire)... en neutralisant les humains! A probablement fourni l'idée
de départ de Terminator.
- Metropolis de Fritz Lang (1927), où, dans un monde futuriste, les
robots et les humains ne parviennent plus à coexister ;
- L'Homme
bicentenaire de Chris Colombus, où un robot cherche à devenir humain quand il découvre ses émotions ;
- D.A.R.Y.L., Daryl a un enfant amnésique recueilli sur une route.
Mais finalement, le gouvernement cherche à détruire le data analyzing robot youth lifeform ;
- La trilogie des Matrix où les machines asservissent les
humains ;
- A.I. Intelligence artificielle de Steven Spielberg. Le personnage central est certainement un aboutissement ultime - mais pour l'instant
seulement imaginaire - de l'intelligence artificielle : un enfant-robot doué d'émotions et de sentiments ;
- I, Robot avec Will Smith, thème semblable au film IA.

