www

Unnamed repository; edit this file 'description' to name the repository.
Log | Files | Refs

rapport.tex (26642B)


      1 \documentclass[french,a4paper]{article}
      2 \usepackage[utf8]{inputenc}
      3 \usepackage[T1]{fontenc}
      4 \usepackage[frenchb]{babel}
      5 \usepackage{tikz}
      6 \usetikzlibrary{shapes,positioning,snakes,calc,chains}
      7 \usepackage{hyperref}
      8 \hypersetup{%
      9   colorlinks,%
     10   citecolor=black,%
     11   filecolor=black,%
     12   linkcolor=black,%
     13   urlcolor=black%
     14 }
     15 
     16 \title{FMIN327 Cognition individuelle et collective\\Protocoles artificiels entre agents naturels}
     17 \author{BONAVERO Yoann \and DUPÉRON Georges}
     18 
     19 \begin{document}
     20 
     21 \maketitle
     22 \begin{abstract}
     23   Dans cet article, nous effecteuons une étude comparative de
     24   différents protocoles de communication utilisés par les humains
     25   susceptibles d'être utilisés dans la communication homme-machine,
     26   sans grand apprentissage de la part des humains. Nous montrons qu'en
     27   général, le niveau d'expressivité d'une langue est inversément
     28   proportionnel à son niveau de formalisme. Nous montrons aussi que
     29   les langages centrés sur un domaine d'application peuvent être à la
     30   fois expressifs dans ce domaine et avoir un haut niveau de
     31   formalisme.
     32 \end{abstract}
     33 \tableofcontents
     34 \newpage
     35 
     36 \section{Introduction}
     37 \subsection{Approche générale}
     38 Tout individu quel qu'il soit, privé de toutes formes de communication, 
     39 d'émotions et de sensations, ne peut en aucune manière évoluer et 
     40 former de groupes cohérents. L'intégrité et la cohérence d'un groupe 
     41 passent majoritairement par un échange d'informations entre les individus.
     42 Celles-ci ne peuvent pas être transmises n'importe comment, les individus 
     43 constituant le groupe doivent être en mesure de les comprendre. 
     44 
     45 Le formatage de l'information devient essentiel, tout comme le 
     46 support qui va être utilisé pour la transmettre.
     47 Au fil du temps les individus ont appris à échanger des idées et des 
     48 concepts de diverses manières. Que ce soit par le biais de gestes, de 
     49 dessin, de rictus ou bien d'autres, les hommes ont petit à petit mis en 
     50 place un moyen de communication efficace. Toutes ces façons de 
     51 transmettre l'information ont sans cesse évolué pour répondre en 
     52 permanance aux besoins.
     53 
     54 Dans la communication il est possible de regrouper en deux grandes
     55 catégorie les protocoles de communication. Il y a ceux qui sont
     56 "naturels", qui ont évolués de manière organique au fil des années, et
     57 ceux qui sont inventés par un «individu» dit artificiels.
     58 
     59 \subsection{But de l'étude}
     60 Le but de cette étude est de trouver un ou des protocoles de
     61 communication entre agents qui seraient facilement appris par des
     62 agents naturels (les humains), qui pourraient de préférence être
     63 utilisés dans la communication de tous les jours (cela assurerait que
     64 les humains maîtriseraient bien le protocole), et qui seraient
     65 facilement «compris» par une machine.
     66 
     67 Comme un tel protocole n'existe probablement pas, nous étudierons la
     68 facilité d'apprentissage par les humains, l'expressivité et la
     69 facilité de compréhension par une machine de plusieurs protocoles,
     70 afin de trouver les caractéristiques du protocole qui semblent lui
     71 permettre de satisfaire ces trois critères.
     72 
     73 % TODO : nettoyer un peu ça vis-à-vis du paragraphe ci-dessus.
     74 Nous nous intéresserons donc principalement aux protocoles
     75 artificiels. En effet, les protocoles naturels, de part leur évolution
     76 non contrôlée au fil du temps ont tendance à être très ambigus, et
     77 avoir une grammaire comportant beaucoup d'exceptions (donc difficile à
     78 interpréter), et une syntaxe approximative, qui accepte différents
     79 ordres pour les mots d'une phrase, mais souvent avec une différence
     80 dans la sémantique.
     81 
     82 Nous chercherons aussi à ce que les protocoles étudiés soient
     83 formels. En d'autre termes ceux qui ont des normes, des règles bien
     84 définies, qui permettent de définir le protocole de manière unique et
     85 sans ambigüités, ce qui facilite leur interprétation par la
     86 machine. La plupart des protocoles artificiels ont une syntaxe et une
     87 grammaire plutôt rigoureuse.
     88 
     89 Nous considérerons les protocoles parlés couramment par un gand nombre
     90 d'agents naturels (des humains). Nous n'explorerons pas la possibilité
     91 d'utiliser ces mêmes protocoles entre des agents artificiels comme des
     92 robots ou des ordinateurs, ni des protocoles prévus dans ce but (car
     93 ils sont en général inadaptés à l'apprentissage par les humains).
     94 
     95 \subsection{Critères}
     96 Pour chaque protocole de communication, nous étudierons plusieurs critères~:
     97 \begin{itemize}
     98 \item La facilité d'apprentissage par un individu.
     99 \item L'ambigüité de son vocabulaire, sa grammaire et sa syntaxe,
    100   autrement dit la difficulté qu'une machine aura à comprendre le
    101   protocole.
    102 \item L'expressivité du protocole, autrement dit la facilité avec
    103   laquelle un humain pourra exprimer des concepts et relations
    104   complexes.
    105 \end{itemize}
    106 
    107 \section{Les langues naturelles}
    108 
    109 Les langues naturelles sont les protocoles de communication les mieux
    110 maîtrisés par les humains.
    111 
    112 Cependant, le vocabulaire est source d'ambigüité, d'une part à cause
    113 des multiples définitions d'un mot, et des connotations qu'il peut
    114 acquérir selon son contexte, et d'autre part à cause des néologismes
    115 qui ne seraient pas encore répertoriés dans un dictionnaire, dont le
    116 sens est difficile à déterminer de manière certaine en utilisant
    117 seulement leur étymologie.
    118 
    119 De même, comme expliqué précédemment, leur grammaire est irrégulière
    120 et bien qu'elle permette souvent de faciliter la compréhension de la
    121 phrase (on pourra rattacher un adjectif au féminin seulement aux
    122 substantifs féminins de la phrase, ce qui élimine des combinaisons
    123 possibles), les mots invariables et autres exceptions apparaissent
    124 trop souvent pour que l'on puisse compter dessus.
    125 
    126 La syntaxe de ces langues est elle aussi une grande source d'ambigüité
    127 puisque changer l'ordre des mots d'une phrase peut résulter en une
    128 autre phrase correcte, mais avec un sens plus ou moins différent de la
    129 première, sans qu'il y ait vraiment de règles formelles décrivant
    130 cela.
    131 
    132 L'expressivité des langues naturelles est très grande, bien que pas
    133 illimitée, car il est parfois difficile de décrire des formes et
    134 images, ou encore des sons, des odeurs ou d'autres sensations.
    135 
    136 Les langues naturelles sont donc faciles à apprendre, disposent d'une
    137 grande expressivité, mais sont très ambigues. Il est possible de
    138 réduire un peu l'ambiguité en s'imposant des contraines (uniquement
    139 des phrases «sujet verbe objet» par exemple), auquel cas on perd en
    140 expressivité.
    141 
    142 % TODO : pilud-ml "english (even controlled) for programming".
    143 
    144 \section{Une langue construite : L'Espéranto}
    145 L'espéranto est une langue construite, créée par Ludwik Lejzer
    146 Zamenhof en 1887, dans le but de créer une langue universelle
    147 facilitant la communication entre peuples. L'espéranto compte à ce
    148 jour environ deux millions de locuteurs.
    149 
    150 Ce n'est pas la seule langue construite, parmi les autres on compte le
    151 lojban, créé pour permettre une expression puissante de la logique,
    152 ainsi que les diverses langues créées par J.R.R Tolkien. Nous
    153 prendrons l'espéranto comme exemple parmi les langues construites car
    154 c'est l'une des plus connues.
    155 
    156 Bien que peu de gens parlent l'espéranto, c'est une langue qui est
    157 facile à apprendre. On estime qu'il faut compter 150 heures d'étude
    158 pour pouvoir suivre une conversation courante enespéranto. L'espéranto
    159 est donc relativement facile à apprendre, même pour les gens ne le
    160 parlant pas encore.
    161 
    162 Le vocabulaire de l'espéranto, comme celui de la plupart des langues
    163 naturelles, contient des ambigüités, certains mots sont polysémiques,
    164 et peuvent acquérir un nouveau sens en fonction du
    165 contexte. Cependant, comme l'espéranto est une langue agglutinante, on
    166 peut construire un large vocabulaire avec peu de racines. 
    167 
    168 Cependant, l'espéranto dispose d'un grammaire régulière, c'est à dire
    169 sans exceptions. Cela permet donc de facilement faire une relation
    170 ente l'orthographe d'un mot et sa fonction dans la phrase, en
    171 analysant ses préfixes et suffixes.
    172 
    173 Cette association entre une langue agglutinante et une grammaire
    174 régulière nous permet de penser qu'il «suffit» pour un programme de
    175 comprendre la sémantique des racines et des différents préfixes et
    176 suffixes pour maîtriser une grande partie du vocabulaire, et
    177 «comprendre» des concepts complexes. Par exemple, à partir de la
    178 racine \emph{vid}, qui concerne la vue, on peut facilement comprendre
    179 le verbe voir (\emph{vid}i), le substantif vue (\emph{vid}o), et même
    180 des concepts plus complexes comme le visible et l'invisible
    181 (\emph{vid}ebla kaj ne\emph{vid}ebla).
    182 
    183 La syntaxe de l'espéranto n'est pas beaucoup fixée, comme en latin,
    184 l'ordre des mots importe peu, même s'il permet de mettre l'accent sur
    185 certains mots. Pour qu'une machine produise des phrases, c'est un
    186 avantage, car cela permet de ne pas trop se soucier de l'ordre des
    187 mots sans parler «petit nègre». Pour qu'une machine comprenne les
    188 humains, cela signifie que l'on peut imposer à l'utilisateur d'écrire
    189 ses phrases sous une certaine forme, pour faciliter l'analyse, sans
    190 que cela réduise grandement l'expressivité.
    191 
    192 En ce qui concerne l'expressivité justement, bien que l'espéranto ait
    193 fait l'objet de plusieurs critiques considérant que puisque
    194 l'espéranto était une langue construite il ne pouvait pas avoir la
    195 richesse d'une langue naturelle, il est communément admis par les
    196 espérantistes que l'expressivité de l'espéranto est aussi grande que
    197 celle des langues naturelles. On trouve en espéranto de la poésie, des
    198 discours politiques, des contes pour enfants et même des articles
    199 encyclopédiques (il existe une version de wikipedia en espéranto).
    200 
    201 L'espéranto est donc un protocole de communication relativement facile
    202 à apprendre, disposant d'une grande expressivité, assez ambigu mais
    203 moins que la plupart des langues naturelles. On peut imposer des
    204 contraintes sur la syntaxe (et le vocabulaire, en fixant une
    205 sémantique précises pour les racines) pour le rendre moins ambigu sans
    206 perdre beaucoup en expressivité.
    207 
    208 \section{Logogrammes}
    209 
    210 \subsection{Phonogrammes et syllabaires}
    211 Les phonogrammes sont des caractères utilisés pour représenter un
    212 phonème dans l'écriture d'une langue. Les syllabaires représentent, eux,
    213 une syllabe entière. Ces caractères peuvent être utilisés pour
    214 transcrire la pensée de l'utilisateur.
    215 
    216 Les alphabets utilisant des phonogrammes comportent en général un
    217 faible nombre de caractères et sont donc faciles à apprendre. Les
    218 alphabets syllabaires comportent souvent un nombre de caractères
    219 beaucoup plus grand, car en combinant plusieurs phonèmes, l'espace des
    220 possibilités devient vite vaste.
    221 
    222 Ces notations peuvent être utilisées pour communiquer avec la machine,
    223 soit avec un clavier, soit par reconnaissance de caractères. Excepté
    224 une certaine ambigüité lors de la reconnaissance d'une écriture mal
    225 formée dans le second cas, il n'y a pas beaucoup de place à
    226 l'interprétation.
    227 
    228 Cependant, cette facilité de compréhension par une machine vient au
    229 dépens de l'expressivité, puisque ces protocole ne permet d'encoder
    230 que des phonèmes ou syllabes, et ne dit rien de leur signification.
    231 
    232 Les phonogrammes et syllabaires sont donc faciles à apprendre, avec
    233 une très faible expressivité et peu d'ambigüité.
    234 
    235 \subsection{Idéogrammes et pictogrammes}
    236 
    237 Les pictogrammes sont des caractères représentant des concepts
    238 concrets, en les dessinant, ou avec une forte analogie. Les
    239 idéogrammes sont la combinaison de plusieurs pictogrammes pour
    240 représenter quelque chose d'abstrait.
    241 
    242 Ces notations sont relativement difficiles à apprendre, puisqu'il faut
    243 environ un symbole par concept, et le nombre de caractères est donc
    244 très grand. Par ailleurs, l'expressivité des idéogrammes et
    245 pictogrammes est supérieure à celle des phonogrammes et syllabaires.
    246 
    247 Les idéogrammes et pictogrammes peuvent être assez ambigus, puisqu'un
    248 caractère représentera un concept général, mais sa sémantique précise
    249 viendra du contexte, tout comme le vocabulaire d'une langue.
    250 
    251 Ces écritures peuvent toutefois être utilisées dans la communication
    252 homme-machine, comme le jeu Captain Blood l'a montré, dans lequel le
    253 joueur communique avec différentes races d'extraterrestres au moyen
    254 d'une vingtaine de pictogrammes.
    255 
    256 Les idéogrammes et pictogrammes sont donc plus difficiles à apprendre
    257 que phonogrammes et syllabaires, avec une expressivité plus forte et
    258 une plus grande ambigüité.
    259 
    260 \subsection{Codages et systèmes d'écriture}
    261 \subsubsection{Le morse}
    262 Le code Morse est généralement attribué à Samuel Morse. Ce code à été
    263 inventé pour la télégraphie en 1835.  Il consiste en une série
    264 d'impulsions. Les lettres, chiffres et signes de ponctuation sont
    265 représentés par des séries d'impulsions.  Seulement deux types
    266 d'impulsions sont nécessaires pour tout coder, une impulsion courte
    267 que l'on appelle généralement «Point» et une impulsion longue appellée
    268 «Trait».
    269 
    270 Ce protocole est facile à apprendre pour les humains (une liste de
    271 quelques séries d'impulsions à associer à chaque lettre), mais il est
    272 difficile à utiliser. Bien qu'il ait été utilisé pour la communication
    273 entre humains par l'intermédiaire d'une machine, il s'agit réellement
    274 d'une forme de communication primitive avec cette machine, qui
    275 transmettait l'information à une autre via une ligne télégraphique ou
    276 par ondes radio.
    277 
    278 Ce protocole de communication possède un vocabulaire très restreint
    279 (le point et le trait, soit un bit, qui assemblés forment les lettres
    280 de l'alphabet, chiffres et ponctuation). Il n'y a pas à proprement
    281 parler de grammaire ni de syntaxe, mis à part que l'assemblage des
    282 points et des traits fait émerger des symboles plus «gros» (lettres,
    283 chiffres et ponctuation, puis des mots), que l'on sépare par des
    284 espaces (ou silences). Il est donc très facile à comprendre pour une
    285 machine, car il suffit de transcrire les points et traits en bits 0 et
    286 1, et un simple automate à états finis permettra de décoder ces
    287 séquences de bits en une suite de lettres.
    288 
    289 Cependant, cette compréhension s'arrêtera à une suite de symboles
    290 sans sémantique, car le morse possède une très faible expressivité~:
    291 Il s'agit simplement d'un encodage de l'alphabet, qui lui-même, comme
    292 vu précédemment, nécessite un protocole de plus haut niveau (une
    293 langue, un langage de programmation…) pour transmettre un message
    294 sémantique. Son expressivité est donc comparable à celle du braille
    295 (voir ci-dessous).
    296 
    297 Les militaires ont utilisé ce code pour effectuer des transmissions
    298 codées, et même si un spectre de fréquence radio est toujours réservé
    299 pour les seules émissions en morse, il s'agit réellement de la couche
    300 physique de la communication selon le modèle OSI, soit la couche la
    301 plus basse. Ce code n'apporte pas de grand intérêt en terme de
    302 communication homme-machine~: difficile à manipuler pour les humains,
    303 un vocabulaire très restreint (juste des symboles) et par conséquent
    304 une expressivité faible.
    305 
    306 \subsubsection{Le braille}
    307 Le braille est une manière de représenter l'alphabet. il consiste en
    308 une représentation en relief de l'ensemble des lettres, chiffres,
    309 ponctuation, et autres symboles en relief. Il a été étudié pour
    310 permettre la lecture simplement avec les doigts. Le braille a été mis
    311 au point par Louis Braille en 1824 et reste aujourd'hui après une
    312 série de réformes et normalisations toujours très utilisé.
    313 
    314 Ce protocole est assez facile à apprendre, bien qu'il faille une
    315 certaine habitude pour lire le braille avec les doigts. Son utilité
    316 dans l'échange homme-machine reste, comme pour le Morse, très faible,
    317 et seuls les malvoyants et aveugles ont un intérêt à l'utiliser pour
    318 saisir ou lire du texte sur une plage braille, comme on utiliserait un
    319 clavier et un écran.
    320 
    321 \subsubsection{La langue des signes}
    322 Les différentes langues des signes ont été créées pour permettre la
    323 communication entre personnes muettes et malentendantes. Elle permet
    324 aussi à ces personnes de dialoguer avec les entendants qui ont appris
    325 leur langue des signes.
    326 
    327 La Langue des Signes Française (LSF) permet entre autres l'encodage
    328 des lettres (on peut épeler un mot français en LSF), mais comme ce ne
    329 serait vraiment pas pratique d'épeler une conversation entière, la
    330 LSF possède un grand nombre de signes permettant d'exprimer la plupart
    331 des concepts que la langue française sait exprimer, et les relations
    332 entre ces concepts. La Langue des Signes Française est donc aussi
    333 expressive que les langues parlées.
    334 
    335 Elle se présente comme un «système d'écriture» basé sur des
    336 pictogrammes et idéogrammes, car beaucoup de signes sont une sorte de
    337 mime du concept concret qu'ils expriment, et les autres signes
    338 suffisent à eux seuls à représenter un mot entier.
    339 
    340 La LSF est aussi difficile à apprendre qu'une langue parlée, mais elle
    341 est déjà parlée par un grand nombre de muets, sourds et malentendants.
    342 
    343 Elle présente beaucoup d'ambigüité sur la sémantique des signes (son
    344 vocabulaire), qui peut varier en fonction de la direction ou la
    345 vitesse.
    346 
    347 La grammaire et la syntaxe de la LSF sont différentes de celle du
    348 français (lorsqu'on utilise les signes mais en utilisant l'ordre des
    349 mots du français, on parle de «français signé»). On peut parfois
    350 composer plusieurs signes simultanément pour exprimer directement une
    351 relation entre ces deux signes, par exemple les expressions du visage
    352 sont souvent utilisées pour exprimer une émotion en même temps qu'un
    353 autre signe.
    354 
    355 Un projet, nommé SiSi (Say It Sign It\footnote{Dites-le, signez-le}),
    356 a été lancé par IBM visant à offrir une traduction voix vers langue
    357 des signes. Les machines peuvent donc signer, mais cette langue semble
    358 difficile à interpréter pour une machine, principalement à cause de la
    359 difficulté à comprendre quel signe est effectué à partir d'un flux
    360 d'images.
    361 
    362 Les langues des signes sont donc des protocoles de communication
    363 adaptés à un groupe d'individus, les sourds, malentendants et muets,
    364 mais peu utilisés par les autres personnes. Leur apprentissage
    365 nécessite un assez grand effort, bien que le résultat soit très
    366 intéressant (il permet de communiquer avec une partie de la population
    367 qui est par ailleurs plutôt exclue de la communication entre
    368 humains). Les langues des signes disposent d'une grande expressivité,
    369 mais sont au moins aussi ambigües que les langues parlées, voire
    370 plus. Leur compréhension par la machine est assez difficile, mais leur
    371 expression est possible (et déjà réalisée dans le cadre du projet
    372 SiSi). Leur utilisation en tant que protocole de communication entre
    373 l'homme et la machine n'a pas grand intérêt, par contre, leur
    374 compréhension par la machine à des fins éducatives ou de traduction
    375 est très prometteuse.
    376 
    377 \section{Notations spécifiques à un domaine}
    378 \subsection{Documents techniques et formules mathémathiques}
    379 % TODO
    380 
    381 Les documents techniques, parmi lesquels on peut trouver différentes
    382 vues d'objets (vue en perspective, d'ensemble, de coupe, éclatée…),
    383 sont des représentation très formelle d'objets ou de concepts. Leur
    384 forme est en général assez facile à apprendre pour les humains, car il
    385 s'agit simplement d'un certain nombre de règles à respecter. Ces
    386 documents techniques sont normalisés et laissent place à très peu,
    387 voire aucune ambigüité dans les représentations.
    388 
    389 Les formules mathémathiques forment un autre protocole similaire aux
    390 documents techniques, très formel, bien que beaucoup de personnes
    391 aient tendance à être laxistes sur la syntaxe.
    392 
    393 L'expressivité de ces protocoles est toutefois relative : Tant que
    394 l'on considère uniquement leur domaine d'application, ils restent très
    395 expressifs (quoi de mieux qu'une formule mathémathique pour parler
    396 d'algèbre ?), cependant ces protocoles ne formalisent pas la relation
    397 entre les choses exprimées et leur contexte. En effet il est très
    398 difficile de retrouver la sémantique d'une formule lorsque celle-ci
    399 est déjà écrite et isolée, et si nous comprenons à quoi se réfèrent
    400 les formes dessinées dans une vue éclatée, c'est uniquement par
    401 analogie avec les objets physiques que nous connaissons déjà. De plus,
    402 ces protocoles ne sont expressifs que dans une discipline
    403 particulière.
    404 
    405 Il est assez simple de stocker sur une machine des documents
    406 techniques ou des formules mathémathiques et même de les restituer,
    407 par exemple sous forme visuelle (sur un écran). Ces protocoles sont
    408 relativement faciles à apprendre, et compréhensibles pour une machine,
    409 sont très expressifs mais seulement dans leur domaine. Ils peuvent
    410 donc être adaptés à la communication homme-machine dans un domaine
    411 particulier, mais pour une communication généralisée, il faudra les
    412 utiliser conjointement avec d'autres protocoles.
    413 
    414 \subsection{Langages de programmation spécifiques à un domaine}
    415 
    416 Les langages de programmation spécifiques à un domaine (DSL) sont des
    417 langages artificiels utilisés en informatique pour exprimer des
    418 concepts et relations dans une discipline particulière. De tels
    419 langages ont aussi été utilisés pour une communication entre humains,
    420 par exemple le langage BCL (Buisness Contract Language) permet de
    421 formaliser des contrats, et permet de s'assurer via un programme
    422 informatique que tous les cas possibles ont été réglementés par le
    423 contrat, et que les clauses du contrat ne sont pas incompatibles.
    424 
    425 Ces langages sont assez difficiles à apprendre, mais pas trop, et être
    426 un expert du domaine aide beaucoup.
    427 
    428 Ils présentent une faible ambigüité, puisqu'ils ont été spécialement
    429 conçus pour représenter de manière claire et concise les concepts et
    430 relations propres à leur domaine.
    431 
    432 Ils présentent une forte expressivité, mais seulement dans la
    433 discipline qui les concerne, et souvent présentent de graves lacunes
    434 dans tout ce qui ne touche pas directement à leur domaine.
    435 
    436 \section{Conclusion}
    437 \begin{figure}[h]
    438   \centering
    439   \begin{tikzpicture}[scale=0.5,node distance=0.5cm,font=\footnotesize]
    440     \node at (12,10) {};
    441     \draw[->] (0,0) -- (11cm,0);
    442     \draw[->] (0,0) -- (0,11cm);
    443     \node[anchor=north] at (10cm,0) {Expressivité};
    444     \node[anchor=south,xshift=0.5cm] at (0,11cm) {Formalisme};
    445     
    446     \node[fill=red,  fill opacity=0.5,circle, minimum width=0.5cm,minimum height=0.5cm,inner sep=1mm,rotate=0] (mb) at (1cm,10cm) {};
    447     \node[right=of mb,text width=2cm] (mbtext) {Morse\\Braille};
    448     \draw[draw=red,draw opacity=0.5,thick] (mbtext.170) -- (mb);
    449     
    450     \node[fill=orange, fill opacity=0.5,ellipse,minimum width=1cm,minimum height=0.5cm,inner sep=1mm,rotate=-90] (sph) at (1cm,9.4cm) {};
    451     \node[anchor=west,at=(sph.30),xshift=1.5cm,yshift=-0.8cm,text width=2cm] (s) {Syllabaires\\Phonogrammes};
    452     \draw[draw=orange,draw opacity=0.5,thick] (s.170) -- (sph);
    453     
    454     \node[fill=yellow!80!black, fill opacity=0.5,ellipse,minimum width=3cm,minimum height=0.7cm,inner sep=1mm,rotate=-65] (ipi) at (2cm,8cm) {};
    455     \node[anchor=north,at=(ipi.south),yshift=-1.5cm,xshift=5mm,text width=2cm,text centered] (i) {Idéogrammes\\Pictogramme\\LSF};
    456     \draw[draw=yellow!80!black,draw opacity=0.5,thick] (i) -- (ipi.-15);
    457     
    458     \node[fill=green,fill opacity=0.5,ellipse,minimum width=2.8cm,minimum height=0.8cm,inner sep=1mm,rotate=-45] at (8.5cm,2.5cm) {Espéranto};
    459     \node[fill=blue, fill opacity=0.5,ellipse,minimum width=2.3cm,minimum height=0.7cm,inner sep=1mm,rotate=-20] at (8.5cm,1.5cm) {Français};
    460     
    461     \node[fill=brown,  fill opacity=0.5,circle, minimum width=0.5cm,minimum height=0.5cm,inner sep=1mm,rotate=0] (no) at (6cm,10cm) {};
    462     \node[right=of no,text width=2cm] (notext) {Notations};
    463     \draw[draw=brown,draw opacity=0.5,thick] (notext) -- (no);
    464     
    465     \node[fill=none,circle, minimum width=0.5cm,minimum height=0.5cm,inner sep=1mm,rotate=0] (bcl) at (6cm,9cm) {};
    466     \node[right=of bcl,text width=2cm] (bcltext) {DSL};
    467     \draw[draw=brown,draw opacity=0.5,thick] (bcltext.west) -- (no);
    468     
    469     \draw[draw=black,line width=1mm,draw opacity=0.5] (0.2,10.8) -- (10.8,0.2);
    470   \end{tikzpicture}
    471   \caption{Comparaison de l'expressivité et du formalisme des différents protocoles.}
    472 \end{figure}
    473 
    474 Dans le graphique ci-dessus, le protocole de communication
    475 homme-machine idéal serait situé dans le coin supérieur droit, avec
    476 une forte expressivité et un formalisme élevé. L'étude des protocoles
    477 existant montre qu'en général, le niveau de formalisme est inversément
    478 proportionnel à l'expressivité. Le graphique représentant le
    479 formalisme en fonction de la facilité d'apprentissage est sensiblement
    480 le même, et n'a donc pas été représenté ici.
    481 
    482 Bien que l'espéranto présente des avantages par rapport à la plupart
    483 des langues naturelles, il présente beaucoup d'ambigüité. Les
    484 protocoles qui semblent réellement faire exception sont les notations
    485 spécifiques à un domaine (DSL, notations mathémathiques, vues
    486 normalisées…). Cette apparente supériorité résulte du fait que ces
    487 protocoles sont très expressifs dans leur spécialité, et uniquement
    488 celle-là, ce qui leur permet d'atteindre un haut niveau de formalisme
    489 en sacrifiant leur expressivité dans d'autres domaines.
    490 
    491 Il serait donc envisageable d'utiliser pour la communication
    492 homme-machine une collection de langages spécifiques à un domaine : Un
    493 protocole pour le déroulement global de la conversation, un ou
    494 plusieurs permettant de faire la liaison entre les concepts et
    495 relations exprimés dans différents protocoles, puis un pour chaque
    496 domaine pour lequel on veut converser avec la machine. Cela exigerait
    497 un effort d'apprentissage plus élevé pour l'agent naturel, car il
    498 faudrait qu'il apprenne un nouveau protocole pour chaque
    499 dicipline. Cependant, cet effort d'apprentissage serait morcelé :
    500 l'utilisateur pourrait commencer par apprendre seulement quelques
    501 protocoles, converser avec la machine, puis au fil des besoins
    502 apprendre de nouveaux protocoles au fur et à mesure.
    503 
    504 Cette technique serait la contraposée de l'hypothèse de Sapir-Whorf~:
    505 Plutôt que de supposer que la langue utilisée conditionne la pensée du
    506 locuteur, le locuteur utiliserait la «langue» adaptée aux pensées
    507 qu'il veut véhiculer.
    508 
    509 Pour résumer, l'utilisateur dialoguerait avec la machine en utilisant
    510 une multitude de «jargons» adaptés à une communication efficace et
    511 sans ambigüités dans leur domaine, et quelques protocoles transversaux
    512 pour articuler la discussion et relier entre eux les fragments de
    513 conversation rédigés dans des langages différents.
    514 
    515 \end{document}