Émergence d’une langue

Il s’agit du sujet de thèse professionnelle effectué au cours de ma cinquième année à l’eXia. Ce travail de recherche,d’étude et de synthèse m’a permis de valider mon année.

Chaque article correspond à un ou plusieurs chapitres de ce travail, il n’est toutefois pas impossible que certains chapitres ne soit pas présent sur ce blog.

L’émergence d’une langue commune ou d’un mode de communication commun peut-elle être expliquée par un processus cognitif?

Préambule

L’intelligence artificielle est un domaine actuellement en plein essor. Les fonds alloués à la recherche dans ces domaines sont considérables. Chaque parution amène régulièrement ses nouveautés et ses innovations dans la découverte de nouveaux comportements intelligents réalisés par des robots aux capacités de plus en plus étonnantes.

Plus généralement, la vie artificielle fascine l’homme et réveille chez lui les plus grands fantasmes de l’humanité. Déjà dans l’œuvre de Mary Shelley en 1818, Frankenstein avait fasciné les foules et avait posé les fondements de la science-fiction et la création de la vie artificielle. Voilà près de 40 ans, l’homme a marché sur la lune ce qui a été annoncé comme l’avènement majeur de la conquête spatiale du vingtième siècle. Peut-être pouvons-nous envisager un jour que l’homme sera émerveillé par la naissance du premier robot humanoïde doué d’une intelligence et de la même compréhension qu’un être humain et que celui-ci pourra communiquer avec nous et dire « C’est un petit pas pour la robotique, mais un bond de géant pour l’humanité. ».

Plus concrètement, même si cet avenir parait peu probable, l’utilisation de l’intelligence artificielle est de plus en plus présente dans notre vie de tous les jours, et rien ne permet de présager que cela va changer. Depuis 50 ans, la société IBM effectue ses recherches sur des logiciels intelligents capables de s’adapter de manière autonome aux besoins des systèmes d’informations de l’entreprise. D’autres recherches ont permis à IBM de réaliser GTP (Système de démonstration de théorèmes géométriques), le premier programme capable de démontrer par son propre raisonnement des théorèmes géométriques existants. Sur internet, la course à la pertinence des recherches actuellement dominés par Google permet des avancées considérables dans l’étude et la compréhension des langages naturels, l’objectif étant de permettre aux internautes de poser tout type de questions et d’obtenir la réponse souhaitée grâce au moteur de recherche qui aura compris le sens de la question et ne se sera pas contenté de rechercher des mots-clés dans son index.

Aujourd’hui, on utilise l’intelligence artificielle pour apporter des réponses aussi bien à des questions d’anthropologie comme l’émergence des langages, ou encore aux neurosciences avec les réseaux de neurones. Les jeux utilisent de plus en plus l’intelligence artificielle pour simuler des joueurs. Ces Intelligences artificielles sont capables de s’adapter au fur et à mesure des parties et ne sont plus le simple résultat d’un algorithme informatique. Par exemple, l’ordinateur Deep Blue est désormais capable de gagner face au champion du monde d’échecs. Les minis-robots sont de plus en plus utilisés pour réaliser des tâches impossibles pour l’homme. Progressivement, ces robots ont été dotés de comportements intelligents capables de s’adapter à des situations nouvelles. Les robots sont désormais capables de s’organiser afin de résoudre en groupe des problèmes qu’ils n’auraient pu résoudre seuls.

Dans cette thèse, nous nous intéresserons à certains de ces aspects de l’intelligence artificielle et nous réfléchirons à l’utilisation et à l’adaptation de systèmes existants pour répondre à notre problématique.

Introduction

Présentation du sujet

Pendant longtemps, des chercheurs dans différents domaines ont exploré les différentes étapes du développement humain pour en comprendre ses mécanismes et ses rouages dans l’objectif de transposer ses différents comportements aux machines afin de reproduire une intelligence artificielle. Ces études ont permis de véritables prouesses technologiques qui ne cessent de nous étonner.

Pourtant, depuis quelques années, on emprunte le chemin inverse et les chercheurs utilisent de plus en plus l’intelligence artificielle pour mieux comprendre les principales phases de notre évolution et l’émergence de notre civilisation. En effet, la rapidité et les capacités croissantes des outils informatiques permettent à partir de modèles simplifiés de reproduire de manière accélérée et en temps réel notre évolution. Ce concept est d’ailleurs utilisé depuis longtemps dans des modélisations de l’expansion de l’univers.

Ainsi, des chercheurs et des informaticiens ont pu reproduire la théorie de Darwin grâce à un programme informatique reproduisant parfaitement des mutations génétiques aléatoires. Avant,cela était impossible, les chercheurs ne pouvaient que remonter le fil du temps pour comprendre les étapes de la vie, désormais, ils peuvent commencer l’étude par le début. Plus étonnant encore, en 2007, des chercheurs de l’université de l’Ecole polytechnique fédérale de Lausanne ont démontré que des robots soumis au hasard étaient capables après sélection sur plusieurs générations de développer un mode de communication afin de trouver plus rapidement de la nourriture.

A l’aide de ces nouvelles technologiques, les linguistes tentent aujourd’hui de valider l’hypothèse qu’une seule langue serait à l’origine de toutes les autres. En effet, quand on étudie les différentes langues vivantes et mortes, on constate de fortes similitudes dans les sons, les syntaxes et les différentes grammaires. Ainsi, le mot « mère » se dit « mother » en anglais, « motyna » en lituanien ou encore « mat’ » en russe.

Wikimedia Commons Tour de Babel

Wikimedia Commons Tour de Babel

Même si pour ces langues, cela peut paraître logique en raison de la domination romaine de l’époque où tout l’empire parlait le latin. On retrouve ces similitudes dans d’autres langues comme les langues indiennes ou encore slaves. Partant de ces similitudes, de nombreuses théories tendent à déterminer l’existence d’une seule et même langue ayant été à l’origine de toutes les autres. Réveillant ainsi le mythe de Babel, l’idée qu’une seule et même tribu d’hommes modernes préhistoriques aurait pu inventer une langue et la propager à travers le monde entier a de quoi séduire.

Ci-après, vous trouverez une version simplifiée de l’arbre des langues indo-européennes. La plupart des linguistes acceptent l’idée qu’une seule et même protolangue serait à l’origine de toute une famille de langues dites « indo-européennes » née il y a entre 8000 et 9500 ans.

Schéma simplifié de l'arbre des langues indo-européennes

Schéma simplifié de l'arbre des langues indo-européennes

Edit du 30/07/2012 : Ce schéma regroupe les langues Ariano-Gréco-arménien pour simplifier la classification et regrouper ces différents langues sous une seule et même langue commune afin de montrer l’origine unique du langage. Il est évident que la classification des langues est plus complexe que cela, et que l’arménien, au même titre l’albanais, sont aujourd’hui considéré par la majorité des linguistes comme étant des groupes à part entière au sein de leurs familles respectives.

On aurait donc pour préciser

  • la famille helleno-phygrien constituée des langues grecs et de l’arménien qui forme un groupe indépendant au sein de cette famille
  • la famille thraco-illyriennes constitué de l’albanais, les autres groupes ayant été pour la plupart re-classifiés dans d’autres familles (Hypothèse encore à l’heure actuelle)
  • la famille indo-iraniennes qui elle regroupe les branches iraniennes et aryennes à l’origine des langues perses et hindi.

Cette classification des langues évolue encore de nos jours au fur et à mesures des découvertes et des études. Des groupes de langues peuvent être identifiés comme une famille ou un groupe à part entière à fortiori. Ils sont pourtant parfois reconsidéré et re-classifié soit au sein d’un ensemble plus vaste, soit au sein d’un sous groupes plus restreint selon les études et les points de vues.

Toutefois, cette théorie ne parait pas convaincre l’ensemble de la communauté scientifique. De nombreux linguistes et anthropologues pensent que l’apparition du langage coïncide avec l’arrivée de l’homme moderne. Or, il est impossible à l’heure actuelle de prouver que l’Homo erectus a évolué vers l’Homo sapiens (ou homme moderne) dans une seule et même région et que celui-ci aurait ensuite migré pour coloniser toute la planète et ainsi remplacer toutes les autres espèces. Une autre théorie démontre que l’homme aurait évolué vers l’homme moderne presque simultanément dans plusieurs régions isolées du monde. L’idée d’une langue mère supposerait donc que l’avantage tiré d’une telle capacité de communiquer aurait permis de s’accroitre largement sur la planète et ainsi d’imposer sa langue.

Schéma des 3 scénarios de l'apparition de l'homme moderne Repris et adapté du site Hominides.com

Schéma des 3 scénarios de l'apparition de l'homme moderne Repris et adapté du site Hominides.com

La solution la plus probable serait que l’Homo erectus avait déjà acquis la faculté de parler mais que les langues ne seraient apparues que plus tard lors de son évolution vers l’homme moderne. Cette hypothèse serait confirmée par le fait que seul l’Homme moderne dispose d’un appareil vocal capable d’articuler des sons. Depuis les années 90, des études montrent que l’Homo erectus disposait finalement d’un appareil vocal suffisant pour articuler quelques sons et qu’avec ces quelques phonèmes (sons), il pouvait inventer un vocabulaire assez varié ou du moins suffisant pour communiquer en complément du langage gestuel. Différentes langues auraient donc pu apparaître simultanément dans plusieurs régions isolées.

Mais alors comment expliquer les ressemblances observées dans les différentes langues ? La raison la plus simple serait due au jeu des migrations très importantes de l’époque, différentes langues auraient été supprimées ou remplacées par une autre sous l’influence d’une langue plus répandue ou d’une colonie dominatrice. Tout comme cela s’est produit avec l’empire romain qui a imposé le latin au détriment de langues plus anciennes. Le commerce et les échanges entre les différentes tribus et/ou ethnies au fils du temps pourraient également expliquer en partie ces ressemblances.

De plus, il existe des similitudes entre des langues n’ayant aucun lien de parenté entre elles, parlées dans des lieux et des époques très éloignés. Là où les historiens ne voient que le fruit du hasard, les linguistes et les généticiens pensent qu’il s’agirait en fait d’une conséquence de la physiologie humaine. De par son héritage génétique, chaque être humain dispose d’un appareil vocal dont les caractéristiques sont relativement proches et chacun présente un même système de pensées et de perception de la parole. Les ressemblances ne seraient donc pas liées à l’existence d’une langue mère mais seraient la conséquence d’un socle cognitif commun propre à tous les hommes. Ce socle cognitif serait la résultante de l’unité de l’espèce humaine sur le plan psychologique et physique. Selon Chomsky (un célèbre linguiste), l’aptitude au langage est un système biologique inné au même titre que la vision et ne relève donc d’aucun enseignement. Nous sommes conditionnés par notre patrimoine génétique, « Notre biologie ne nous permet pas de produire ou de combiner n’importe quel son, car le langage est le produit de notre évolution naturelle ». Ainsi un enfant est de manière innée apte à apprendre de nouveaux mots et d’en assimiler rapidement le sens. L’enfant assimile naturellement la grammaire car il est doté d’une grammaire universelle propre aux êtres humains. « La grammaire universelle constitue donc un ensemble de contraintes inconscientes qui nous permet de décider si une phrase est bien formée. Cette grammaire mentale n’est pas nécessairement identique pour toutes les langues, mais le processus par lequel, pour une langue donnée, certaines phrases sont perçues comme correctes et d’autres non serait, lui, universel et indépendant de la signification. »

Partant de l’hypothèse d’un socle cognitif commun, cette thèse a pour objectif de trouver un modèle cognitif simple permettant l’émergence d’un mode de communication et/ou d’une langue commune entre robots. Afin de réaliser cette étude, on s’attachera essentiellement à une approche pragmatique du langage, c’est-à-dire la communication entre plusieurs individus créant ainsi une synergie dans l’objectif d’atteindre un objectif commun.

Démarche proposée

Dans l’objectif de proposer une démarche constructive et permettant de répondre à la problématique, nous allons dans un premier temps formuler des hypothèses. Celles-ci vont permettre de mettre en place différentes pistes de recherche et nous conduire à l’étude approfondie de deux domaines :

  • Les Sciences Cognitives
  • Les Systèmes d’intelligences artificielles

Les sciences cognitives permettent une compréhension des mécanismes du comportement humain. L’étude de ce domaine doit donc permettre de comprendre les différents mécanismes du cerveau qui peuvent interagir lors de l’apprentissage d’une langue.

L’étude des systèmes d’intelligences artificielles devrait nous donner les connaissances nécessaires à la conception d’un modèle cognitif simple, laissant entrevoir la possibilité de l’émergence d’un langage commun entre plusieurs robots.

Les expériences décrites dans la suite de cette thèse mettent en place une démarche théorique permettant de proposer une première réponse aux hypothèses choisies. Toutefois, celles-ci ne pourront être véritablement validées qu’après une mise en pratique de ces expériences qui ne peut se faire dans le cadre de cette thèse.

Démarche proposée

Démarche proposée

Hypothèses

Afin d’orienter mes recherches, je me suis posé un certain nombre hypothèses. Les études effectuées au cours de ma thèse m’ont permis d’adapter la formulation de celles-ci au vocabulaire couramment utilisé dans cette discipline. Seules les hypothèses qui m’ont paru pertinentes ont été conservées. A contrario, suite à une étude plus approfondie, d’autres hypothèses ont pu venir enrichir ce travail de recherche.

Langage

  • La faculté de parler n’est qu’une conséquence de la physiologie humaine
  • Le langage ne représente pas en soi un signe d’intelligence même s’il s’agit pourtant d’un comportement intelligent
  • L’apparition du langage chez l’homme lui a permis de compenser son handicap physique face aux autres animaux
  • L’émergence d’une langue au sein d’un groupe ne peut se faire que si le groupe partage des objectifs communs et doit faire face aux mêmes difficultés
  • Le langage de l’homme, s’il n’est vu que comme un mode de communication, peut être considéré comme aussi évolué que celui utilisé par les fourmis. La différence fondamentale entre ces deux modes de communication ne dépend pas d’une capacité intellectuelle différente mais est liée aux contraintes de leur environnement pour la survie de leurs espèces
  • La capacité d’apprentissage d’une langue repose sur un mode fonctionnement similaire à celui d’un bébé qui apprend à marcher. Il s’agit d’une conséquence logique due aux interactions successives avec un environnement extérieur, celui ci comprenant l’ensemble des matériaux qui nous entourent mais aussi les interactions avec d’autres personnes.
  • Le langage de l’homme est le plus diversifié et le plus abouti car il dispose d’une capacité physique lui permettant d’émettre plus de sons que les autres animaux. La diversité de son langage dépend donc du nombre de possibilités offertes par son appareil phonatoire.

L’ensemble de ces hypothèses ont été écrites suite à une étude préalable pour mon sujet de thèse. Ces hypothèses sont donc pour la plupart considérées comme vraies et immuables (dans le cade de ma thèse), cela me permet de les utiliser comme base pour mes recherches ultérieures.

Science cognitive

  • Le langage est une réaction physique et chimique, il s’agit du résultat d’un système cognitif
  • L’homme est un système cognitif similaire à un robot
  • Un robot serait capable de communiquer avec l’homme s’il était doté d’un socle cognitif aussi complet que lui, c’est-à-dire des mêmes capacités d’interaction avec son environnement.

Intelligence artificielle

  • Un système multi-agents basé sur des agents dotés d’un système complexe peut présenter les conditions nécessaires à l’émergence d’une langue
  • Un système multi-agents permet de modéliser un système similaire aux relations humaines
  • Il est impossible de prévoir à l’avance à quel moment et sous quelle forme une langue peut émerger

Vous pouvez consulter la suite des chapitres dans  les articles: