rapport.tex (26642B)
1 \documentclass[french,a4paper]{article} 2 \usepackage[utf8]{inputenc} 3 \usepackage[T1]{fontenc} 4 \usepackage[frenchb]{babel} 5 \usepackage{tikz} 6 \usetikzlibrary{shapes,positioning,snakes,calc,chains} 7 \usepackage{hyperref} 8 \hypersetup{% 9 colorlinks,% 10 citecolor=black,% 11 filecolor=black,% 12 linkcolor=black,% 13 urlcolor=black% 14 } 15 16 \title{FMIN327 Cognition individuelle et collective\\Protocoles artificiels entre agents naturels} 17 \author{BONAVERO Yoann \and DUPÉRON Georges} 18 19 \begin{document} 20 21 \maketitle 22 \begin{abstract} 23 Dans cet article, nous effecteuons une étude comparative de 24 différents protocoles de communication utilisés par les humains 25 susceptibles d'être utilisés dans la communication homme-machine, 26 sans grand apprentissage de la part des humains. Nous montrons qu'en 27 général, le niveau d'expressivité d'une langue est inversément 28 proportionnel à son niveau de formalisme. Nous montrons aussi que 29 les langages centrés sur un domaine d'application peuvent être à la 30 fois expressifs dans ce domaine et avoir un haut niveau de 31 formalisme. 32 \end{abstract} 33 \tableofcontents 34 \newpage 35 36 \section{Introduction} 37 \subsection{Approche générale} 38 Tout individu quel qu'il soit, privé de toutes formes de communication, 39 d'émotions et de sensations, ne peut en aucune manière évoluer et 40 former de groupes cohérents. L'intégrité et la cohérence d'un groupe 41 passent majoritairement par un échange d'informations entre les individus. 42 Celles-ci ne peuvent pas être transmises n'importe comment, les individus 43 constituant le groupe doivent être en mesure de les comprendre. 44 45 Le formatage de l'information devient essentiel, tout comme le 46 support qui va être utilisé pour la transmettre. 47 Au fil du temps les individus ont appris à échanger des idées et des 48 concepts de diverses manières. Que ce soit par le biais de gestes, de 49 dessin, de rictus ou bien d'autres, les hommes ont petit à petit mis en 50 place un moyen de communication efficace. Toutes ces façons de 51 transmettre l'information ont sans cesse évolué pour répondre en 52 permanance aux besoins. 53 54 Dans la communication il est possible de regrouper en deux grandes 55 catégorie les protocoles de communication. Il y a ceux qui sont 56 "naturels", qui ont évolués de manière organique au fil des années, et 57 ceux qui sont inventés par un «individu» dit artificiels. 58 59 \subsection{But de l'étude} 60 Le but de cette étude est de trouver un ou des protocoles de 61 communication entre agents qui seraient facilement appris par des 62 agents naturels (les humains), qui pourraient de préférence être 63 utilisés dans la communication de tous les jours (cela assurerait que 64 les humains maîtriseraient bien le protocole), et qui seraient 65 facilement «compris» par une machine. 66 67 Comme un tel protocole n'existe probablement pas, nous étudierons la 68 facilité d'apprentissage par les humains, l'expressivité et la 69 facilité de compréhension par une machine de plusieurs protocoles, 70 afin de trouver les caractéristiques du protocole qui semblent lui 71 permettre de satisfaire ces trois critères. 72 73 % TODO : nettoyer un peu ça vis-à-vis du paragraphe ci-dessus. 74 Nous nous intéresserons donc principalement aux protocoles 75 artificiels. En effet, les protocoles naturels, de part leur évolution 76 non contrôlée au fil du temps ont tendance à être très ambigus, et 77 avoir une grammaire comportant beaucoup d'exceptions (donc difficile à 78 interpréter), et une syntaxe approximative, qui accepte différents 79 ordres pour les mots d'une phrase, mais souvent avec une différence 80 dans la sémantique. 81 82 Nous chercherons aussi à ce que les protocoles étudiés soient 83 formels. En d'autre termes ceux qui ont des normes, des règles bien 84 définies, qui permettent de définir le protocole de manière unique et 85 sans ambigüités, ce qui facilite leur interprétation par la 86 machine. La plupart des protocoles artificiels ont une syntaxe et une 87 grammaire plutôt rigoureuse. 88 89 Nous considérerons les protocoles parlés couramment par un gand nombre 90 d'agents naturels (des humains). Nous n'explorerons pas la possibilité 91 d'utiliser ces mêmes protocoles entre des agents artificiels comme des 92 robots ou des ordinateurs, ni des protocoles prévus dans ce but (car 93 ils sont en général inadaptés à l'apprentissage par les humains). 94 95 \subsection{Critères} 96 Pour chaque protocole de communication, nous étudierons plusieurs critères~: 97 \begin{itemize} 98 \item La facilité d'apprentissage par un individu. 99 \item L'ambigüité de son vocabulaire, sa grammaire et sa syntaxe, 100 autrement dit la difficulté qu'une machine aura à comprendre le 101 protocole. 102 \item L'expressivité du protocole, autrement dit la facilité avec 103 laquelle un humain pourra exprimer des concepts et relations 104 complexes. 105 \end{itemize} 106 107 \section{Les langues naturelles} 108 109 Les langues naturelles sont les protocoles de communication les mieux 110 maîtrisés par les humains. 111 112 Cependant, le vocabulaire est source d'ambigüité, d'une part à cause 113 des multiples définitions d'un mot, et des connotations qu'il peut 114 acquérir selon son contexte, et d'autre part à cause des néologismes 115 qui ne seraient pas encore répertoriés dans un dictionnaire, dont le 116 sens est difficile à déterminer de manière certaine en utilisant 117 seulement leur étymologie. 118 119 De même, comme expliqué précédemment, leur grammaire est irrégulière 120 et bien qu'elle permette souvent de faciliter la compréhension de la 121 phrase (on pourra rattacher un adjectif au féminin seulement aux 122 substantifs féminins de la phrase, ce qui élimine des combinaisons 123 possibles), les mots invariables et autres exceptions apparaissent 124 trop souvent pour que l'on puisse compter dessus. 125 126 La syntaxe de ces langues est elle aussi une grande source d'ambigüité 127 puisque changer l'ordre des mots d'une phrase peut résulter en une 128 autre phrase correcte, mais avec un sens plus ou moins différent de la 129 première, sans qu'il y ait vraiment de règles formelles décrivant 130 cela. 131 132 L'expressivité des langues naturelles est très grande, bien que pas 133 illimitée, car il est parfois difficile de décrire des formes et 134 images, ou encore des sons, des odeurs ou d'autres sensations. 135 136 Les langues naturelles sont donc faciles à apprendre, disposent d'une 137 grande expressivité, mais sont très ambigues. Il est possible de 138 réduire un peu l'ambiguité en s'imposant des contraines (uniquement 139 des phrases «sujet verbe objet» par exemple), auquel cas on perd en 140 expressivité. 141 142 % TODO : pilud-ml "english (even controlled) for programming". 143 144 \section{Une langue construite : L'Espéranto} 145 L'espéranto est une langue construite, créée par Ludwik Lejzer 146 Zamenhof en 1887, dans le but de créer une langue universelle 147 facilitant la communication entre peuples. L'espéranto compte à ce 148 jour environ deux millions de locuteurs. 149 150 Ce n'est pas la seule langue construite, parmi les autres on compte le 151 lojban, créé pour permettre une expression puissante de la logique, 152 ainsi que les diverses langues créées par J.R.R Tolkien. Nous 153 prendrons l'espéranto comme exemple parmi les langues construites car 154 c'est l'une des plus connues. 155 156 Bien que peu de gens parlent l'espéranto, c'est une langue qui est 157 facile à apprendre. On estime qu'il faut compter 150 heures d'étude 158 pour pouvoir suivre une conversation courante enespéranto. L'espéranto 159 est donc relativement facile à apprendre, même pour les gens ne le 160 parlant pas encore. 161 162 Le vocabulaire de l'espéranto, comme celui de la plupart des langues 163 naturelles, contient des ambigüités, certains mots sont polysémiques, 164 et peuvent acquérir un nouveau sens en fonction du 165 contexte. Cependant, comme l'espéranto est une langue agglutinante, on 166 peut construire un large vocabulaire avec peu de racines. 167 168 Cependant, l'espéranto dispose d'un grammaire régulière, c'est à dire 169 sans exceptions. Cela permet donc de facilement faire une relation 170 ente l'orthographe d'un mot et sa fonction dans la phrase, en 171 analysant ses préfixes et suffixes. 172 173 Cette association entre une langue agglutinante et une grammaire 174 régulière nous permet de penser qu'il «suffit» pour un programme de 175 comprendre la sémantique des racines et des différents préfixes et 176 suffixes pour maîtriser une grande partie du vocabulaire, et 177 «comprendre» des concepts complexes. Par exemple, à partir de la 178 racine \emph{vid}, qui concerne la vue, on peut facilement comprendre 179 le verbe voir (\emph{vid}i), le substantif vue (\emph{vid}o), et même 180 des concepts plus complexes comme le visible et l'invisible 181 (\emph{vid}ebla kaj ne\emph{vid}ebla). 182 183 La syntaxe de l'espéranto n'est pas beaucoup fixée, comme en latin, 184 l'ordre des mots importe peu, même s'il permet de mettre l'accent sur 185 certains mots. Pour qu'une machine produise des phrases, c'est un 186 avantage, car cela permet de ne pas trop se soucier de l'ordre des 187 mots sans parler «petit nègre». Pour qu'une machine comprenne les 188 humains, cela signifie que l'on peut imposer à l'utilisateur d'écrire 189 ses phrases sous une certaine forme, pour faciliter l'analyse, sans 190 que cela réduise grandement l'expressivité. 191 192 En ce qui concerne l'expressivité justement, bien que l'espéranto ait 193 fait l'objet de plusieurs critiques considérant que puisque 194 l'espéranto était une langue construite il ne pouvait pas avoir la 195 richesse d'une langue naturelle, il est communément admis par les 196 espérantistes que l'expressivité de l'espéranto est aussi grande que 197 celle des langues naturelles. On trouve en espéranto de la poésie, des 198 discours politiques, des contes pour enfants et même des articles 199 encyclopédiques (il existe une version de wikipedia en espéranto). 200 201 L'espéranto est donc un protocole de communication relativement facile 202 à apprendre, disposant d'une grande expressivité, assez ambigu mais 203 moins que la plupart des langues naturelles. On peut imposer des 204 contraintes sur la syntaxe (et le vocabulaire, en fixant une 205 sémantique précises pour les racines) pour le rendre moins ambigu sans 206 perdre beaucoup en expressivité. 207 208 \section{Logogrammes} 209 210 \subsection{Phonogrammes et syllabaires} 211 Les phonogrammes sont des caractères utilisés pour représenter un 212 phonème dans l'écriture d'une langue. Les syllabaires représentent, eux, 213 une syllabe entière. Ces caractères peuvent être utilisés pour 214 transcrire la pensée de l'utilisateur. 215 216 Les alphabets utilisant des phonogrammes comportent en général un 217 faible nombre de caractères et sont donc faciles à apprendre. Les 218 alphabets syllabaires comportent souvent un nombre de caractères 219 beaucoup plus grand, car en combinant plusieurs phonèmes, l'espace des 220 possibilités devient vite vaste. 221 222 Ces notations peuvent être utilisées pour communiquer avec la machine, 223 soit avec un clavier, soit par reconnaissance de caractères. Excepté 224 une certaine ambigüité lors de la reconnaissance d'une écriture mal 225 formée dans le second cas, il n'y a pas beaucoup de place à 226 l'interprétation. 227 228 Cependant, cette facilité de compréhension par une machine vient au 229 dépens de l'expressivité, puisque ces protocole ne permet d'encoder 230 que des phonèmes ou syllabes, et ne dit rien de leur signification. 231 232 Les phonogrammes et syllabaires sont donc faciles à apprendre, avec 233 une très faible expressivité et peu d'ambigüité. 234 235 \subsection{Idéogrammes et pictogrammes} 236 237 Les pictogrammes sont des caractères représentant des concepts 238 concrets, en les dessinant, ou avec une forte analogie. Les 239 idéogrammes sont la combinaison de plusieurs pictogrammes pour 240 représenter quelque chose d'abstrait. 241 242 Ces notations sont relativement difficiles à apprendre, puisqu'il faut 243 environ un symbole par concept, et le nombre de caractères est donc 244 très grand. Par ailleurs, l'expressivité des idéogrammes et 245 pictogrammes est supérieure à celle des phonogrammes et syllabaires. 246 247 Les idéogrammes et pictogrammes peuvent être assez ambigus, puisqu'un 248 caractère représentera un concept général, mais sa sémantique précise 249 viendra du contexte, tout comme le vocabulaire d'une langue. 250 251 Ces écritures peuvent toutefois être utilisées dans la communication 252 homme-machine, comme le jeu Captain Blood l'a montré, dans lequel le 253 joueur communique avec différentes races d'extraterrestres au moyen 254 d'une vingtaine de pictogrammes. 255 256 Les idéogrammes et pictogrammes sont donc plus difficiles à apprendre 257 que phonogrammes et syllabaires, avec une expressivité plus forte et 258 une plus grande ambigüité. 259 260 \subsection{Codages et systèmes d'écriture} 261 \subsubsection{Le morse} 262 Le code Morse est généralement attribué à Samuel Morse. Ce code à été 263 inventé pour la télégraphie en 1835. Il consiste en une série 264 d'impulsions. Les lettres, chiffres et signes de ponctuation sont 265 représentés par des séries d'impulsions. Seulement deux types 266 d'impulsions sont nécessaires pour tout coder, une impulsion courte 267 que l'on appelle généralement «Point» et une impulsion longue appellée 268 «Trait». 269 270 Ce protocole est facile à apprendre pour les humains (une liste de 271 quelques séries d'impulsions à associer à chaque lettre), mais il est 272 difficile à utiliser. Bien qu'il ait été utilisé pour la communication 273 entre humains par l'intermédiaire d'une machine, il s'agit réellement 274 d'une forme de communication primitive avec cette machine, qui 275 transmettait l'information à une autre via une ligne télégraphique ou 276 par ondes radio. 277 278 Ce protocole de communication possède un vocabulaire très restreint 279 (le point et le trait, soit un bit, qui assemblés forment les lettres 280 de l'alphabet, chiffres et ponctuation). Il n'y a pas à proprement 281 parler de grammaire ni de syntaxe, mis à part que l'assemblage des 282 points et des traits fait émerger des symboles plus «gros» (lettres, 283 chiffres et ponctuation, puis des mots), que l'on sépare par des 284 espaces (ou silences). Il est donc très facile à comprendre pour une 285 machine, car il suffit de transcrire les points et traits en bits 0 et 286 1, et un simple automate à états finis permettra de décoder ces 287 séquences de bits en une suite de lettres. 288 289 Cependant, cette compréhension s'arrêtera à une suite de symboles 290 sans sémantique, car le morse possède une très faible expressivité~: 291 Il s'agit simplement d'un encodage de l'alphabet, qui lui-même, comme 292 vu précédemment, nécessite un protocole de plus haut niveau (une 293 langue, un langage de programmation…) pour transmettre un message 294 sémantique. Son expressivité est donc comparable à celle du braille 295 (voir ci-dessous). 296 297 Les militaires ont utilisé ce code pour effectuer des transmissions 298 codées, et même si un spectre de fréquence radio est toujours réservé 299 pour les seules émissions en morse, il s'agit réellement de la couche 300 physique de la communication selon le modèle OSI, soit la couche la 301 plus basse. Ce code n'apporte pas de grand intérêt en terme de 302 communication homme-machine~: difficile à manipuler pour les humains, 303 un vocabulaire très restreint (juste des symboles) et par conséquent 304 une expressivité faible. 305 306 \subsubsection{Le braille} 307 Le braille est une manière de représenter l'alphabet. il consiste en 308 une représentation en relief de l'ensemble des lettres, chiffres, 309 ponctuation, et autres symboles en relief. Il a été étudié pour 310 permettre la lecture simplement avec les doigts. Le braille a été mis 311 au point par Louis Braille en 1824 et reste aujourd'hui après une 312 série de réformes et normalisations toujours très utilisé. 313 314 Ce protocole est assez facile à apprendre, bien qu'il faille une 315 certaine habitude pour lire le braille avec les doigts. Son utilité 316 dans l'échange homme-machine reste, comme pour le Morse, très faible, 317 et seuls les malvoyants et aveugles ont un intérêt à l'utiliser pour 318 saisir ou lire du texte sur une plage braille, comme on utiliserait un 319 clavier et un écran. 320 321 \subsubsection{La langue des signes} 322 Les différentes langues des signes ont été créées pour permettre la 323 communication entre personnes muettes et malentendantes. Elle permet 324 aussi à ces personnes de dialoguer avec les entendants qui ont appris 325 leur langue des signes. 326 327 La Langue des Signes Française (LSF) permet entre autres l'encodage 328 des lettres (on peut épeler un mot français en LSF), mais comme ce ne 329 serait vraiment pas pratique d'épeler une conversation entière, la 330 LSF possède un grand nombre de signes permettant d'exprimer la plupart 331 des concepts que la langue française sait exprimer, et les relations 332 entre ces concepts. La Langue des Signes Française est donc aussi 333 expressive que les langues parlées. 334 335 Elle se présente comme un «système d'écriture» basé sur des 336 pictogrammes et idéogrammes, car beaucoup de signes sont une sorte de 337 mime du concept concret qu'ils expriment, et les autres signes 338 suffisent à eux seuls à représenter un mot entier. 339 340 La LSF est aussi difficile à apprendre qu'une langue parlée, mais elle 341 est déjà parlée par un grand nombre de muets, sourds et malentendants. 342 343 Elle présente beaucoup d'ambigüité sur la sémantique des signes (son 344 vocabulaire), qui peut varier en fonction de la direction ou la 345 vitesse. 346 347 La grammaire et la syntaxe de la LSF sont différentes de celle du 348 français (lorsqu'on utilise les signes mais en utilisant l'ordre des 349 mots du français, on parle de «français signé»). On peut parfois 350 composer plusieurs signes simultanément pour exprimer directement une 351 relation entre ces deux signes, par exemple les expressions du visage 352 sont souvent utilisées pour exprimer une émotion en même temps qu'un 353 autre signe. 354 355 Un projet, nommé SiSi (Say It Sign It\footnote{Dites-le, signez-le}), 356 a été lancé par IBM visant à offrir une traduction voix vers langue 357 des signes. Les machines peuvent donc signer, mais cette langue semble 358 difficile à interpréter pour une machine, principalement à cause de la 359 difficulté à comprendre quel signe est effectué à partir d'un flux 360 d'images. 361 362 Les langues des signes sont donc des protocoles de communication 363 adaptés à un groupe d'individus, les sourds, malentendants et muets, 364 mais peu utilisés par les autres personnes. Leur apprentissage 365 nécessite un assez grand effort, bien que le résultat soit très 366 intéressant (il permet de communiquer avec une partie de la population 367 qui est par ailleurs plutôt exclue de la communication entre 368 humains). Les langues des signes disposent d'une grande expressivité, 369 mais sont au moins aussi ambigües que les langues parlées, voire 370 plus. Leur compréhension par la machine est assez difficile, mais leur 371 expression est possible (et déjà réalisée dans le cadre du projet 372 SiSi). Leur utilisation en tant que protocole de communication entre 373 l'homme et la machine n'a pas grand intérêt, par contre, leur 374 compréhension par la machine à des fins éducatives ou de traduction 375 est très prometteuse. 376 377 \section{Notations spécifiques à un domaine} 378 \subsection{Documents techniques et formules mathémathiques} 379 % TODO 380 381 Les documents techniques, parmi lesquels on peut trouver différentes 382 vues d'objets (vue en perspective, d'ensemble, de coupe, éclatée…), 383 sont des représentation très formelle d'objets ou de concepts. Leur 384 forme est en général assez facile à apprendre pour les humains, car il 385 s'agit simplement d'un certain nombre de règles à respecter. Ces 386 documents techniques sont normalisés et laissent place à très peu, 387 voire aucune ambigüité dans les représentations. 388 389 Les formules mathémathiques forment un autre protocole similaire aux 390 documents techniques, très formel, bien que beaucoup de personnes 391 aient tendance à être laxistes sur la syntaxe. 392 393 L'expressivité de ces protocoles est toutefois relative : Tant que 394 l'on considère uniquement leur domaine d'application, ils restent très 395 expressifs (quoi de mieux qu'une formule mathémathique pour parler 396 d'algèbre ?), cependant ces protocoles ne formalisent pas la relation 397 entre les choses exprimées et leur contexte. En effet il est très 398 difficile de retrouver la sémantique d'une formule lorsque celle-ci 399 est déjà écrite et isolée, et si nous comprenons à quoi se réfèrent 400 les formes dessinées dans une vue éclatée, c'est uniquement par 401 analogie avec les objets physiques que nous connaissons déjà. De plus, 402 ces protocoles ne sont expressifs que dans une discipline 403 particulière. 404 405 Il est assez simple de stocker sur une machine des documents 406 techniques ou des formules mathémathiques et même de les restituer, 407 par exemple sous forme visuelle (sur un écran). Ces protocoles sont 408 relativement faciles à apprendre, et compréhensibles pour une machine, 409 sont très expressifs mais seulement dans leur domaine. Ils peuvent 410 donc être adaptés à la communication homme-machine dans un domaine 411 particulier, mais pour une communication généralisée, il faudra les 412 utiliser conjointement avec d'autres protocoles. 413 414 \subsection{Langages de programmation spécifiques à un domaine} 415 416 Les langages de programmation spécifiques à un domaine (DSL) sont des 417 langages artificiels utilisés en informatique pour exprimer des 418 concepts et relations dans une discipline particulière. De tels 419 langages ont aussi été utilisés pour une communication entre humains, 420 par exemple le langage BCL (Buisness Contract Language) permet de 421 formaliser des contrats, et permet de s'assurer via un programme 422 informatique que tous les cas possibles ont été réglementés par le 423 contrat, et que les clauses du contrat ne sont pas incompatibles. 424 425 Ces langages sont assez difficiles à apprendre, mais pas trop, et être 426 un expert du domaine aide beaucoup. 427 428 Ils présentent une faible ambigüité, puisqu'ils ont été spécialement 429 conçus pour représenter de manière claire et concise les concepts et 430 relations propres à leur domaine. 431 432 Ils présentent une forte expressivité, mais seulement dans la 433 discipline qui les concerne, et souvent présentent de graves lacunes 434 dans tout ce qui ne touche pas directement à leur domaine. 435 436 \section{Conclusion} 437 \begin{figure}[h] 438 \centering 439 \begin{tikzpicture}[scale=0.5,node distance=0.5cm,font=\footnotesize] 440 \node at (12,10) {}; 441 \draw[->] (0,0) -- (11cm,0); 442 \draw[->] (0,0) -- (0,11cm); 443 \node[anchor=north] at (10cm,0) {Expressivité}; 444 \node[anchor=south,xshift=0.5cm] at (0,11cm) {Formalisme}; 445 446 \node[fill=red, fill opacity=0.5,circle, minimum width=0.5cm,minimum height=0.5cm,inner sep=1mm,rotate=0] (mb) at (1cm,10cm) {}; 447 \node[right=of mb,text width=2cm] (mbtext) {Morse\\Braille}; 448 \draw[draw=red,draw opacity=0.5,thick] (mbtext.170) -- (mb); 449 450 \node[fill=orange, fill opacity=0.5,ellipse,minimum width=1cm,minimum height=0.5cm,inner sep=1mm,rotate=-90] (sph) at (1cm,9.4cm) {}; 451 \node[anchor=west,at=(sph.30),xshift=1.5cm,yshift=-0.8cm,text width=2cm] (s) {Syllabaires\\Phonogrammes}; 452 \draw[draw=orange,draw opacity=0.5,thick] (s.170) -- (sph); 453 454 \node[fill=yellow!80!black, fill opacity=0.5,ellipse,minimum width=3cm,minimum height=0.7cm,inner sep=1mm,rotate=-65] (ipi) at (2cm,8cm) {}; 455 \node[anchor=north,at=(ipi.south),yshift=-1.5cm,xshift=5mm,text width=2cm,text centered] (i) {Idéogrammes\\Pictogramme\\LSF}; 456 \draw[draw=yellow!80!black,draw opacity=0.5,thick] (i) -- (ipi.-15); 457 458 \node[fill=green,fill opacity=0.5,ellipse,minimum width=2.8cm,minimum height=0.8cm,inner sep=1mm,rotate=-45] at (8.5cm,2.5cm) {Espéranto}; 459 \node[fill=blue, fill opacity=0.5,ellipse,minimum width=2.3cm,minimum height=0.7cm,inner sep=1mm,rotate=-20] at (8.5cm,1.5cm) {Français}; 460 461 \node[fill=brown, fill opacity=0.5,circle, minimum width=0.5cm,minimum height=0.5cm,inner sep=1mm,rotate=0] (no) at (6cm,10cm) {}; 462 \node[right=of no,text width=2cm] (notext) {Notations}; 463 \draw[draw=brown,draw opacity=0.5,thick] (notext) -- (no); 464 465 \node[fill=none,circle, minimum width=0.5cm,minimum height=0.5cm,inner sep=1mm,rotate=0] (bcl) at (6cm,9cm) {}; 466 \node[right=of bcl,text width=2cm] (bcltext) {DSL}; 467 \draw[draw=brown,draw opacity=0.5,thick] (bcltext.west) -- (no); 468 469 \draw[draw=black,line width=1mm,draw opacity=0.5] (0.2,10.8) -- (10.8,0.2); 470 \end{tikzpicture} 471 \caption{Comparaison de l'expressivité et du formalisme des différents protocoles.} 472 \end{figure} 473 474 Dans le graphique ci-dessus, le protocole de communication 475 homme-machine idéal serait situé dans le coin supérieur droit, avec 476 une forte expressivité et un formalisme élevé. L'étude des protocoles 477 existant montre qu'en général, le niveau de formalisme est inversément 478 proportionnel à l'expressivité. Le graphique représentant le 479 formalisme en fonction de la facilité d'apprentissage est sensiblement 480 le même, et n'a donc pas été représenté ici. 481 482 Bien que l'espéranto présente des avantages par rapport à la plupart 483 des langues naturelles, il présente beaucoup d'ambigüité. Les 484 protocoles qui semblent réellement faire exception sont les notations 485 spécifiques à un domaine (DSL, notations mathémathiques, vues 486 normalisées…). Cette apparente supériorité résulte du fait que ces 487 protocoles sont très expressifs dans leur spécialité, et uniquement 488 celle-là, ce qui leur permet d'atteindre un haut niveau de formalisme 489 en sacrifiant leur expressivité dans d'autres domaines. 490 491 Il serait donc envisageable d'utiliser pour la communication 492 homme-machine une collection de langages spécifiques à un domaine : Un 493 protocole pour le déroulement global de la conversation, un ou 494 plusieurs permettant de faire la liaison entre les concepts et 495 relations exprimés dans différents protocoles, puis un pour chaque 496 domaine pour lequel on veut converser avec la machine. Cela exigerait 497 un effort d'apprentissage plus élevé pour l'agent naturel, car il 498 faudrait qu'il apprenne un nouveau protocole pour chaque 499 dicipline. Cependant, cet effort d'apprentissage serait morcelé : 500 l'utilisateur pourrait commencer par apprendre seulement quelques 501 protocoles, converser avec la machine, puis au fil des besoins 502 apprendre de nouveaux protocoles au fur et à mesure. 503 504 Cette technique serait la contraposée de l'hypothèse de Sapir-Whorf~: 505 Plutôt que de supposer que la langue utilisée conditionne la pensée du 506 locuteur, le locuteur utiliserait la «langue» adaptée aux pensées 507 qu'il veut véhiculer. 508 509 Pour résumer, l'utilisateur dialoguerait avec la machine en utilisant 510 une multitude de «jargons» adaptés à une communication efficace et 511 sans ambigüités dans leur domaine, et quelques protocoles transversaux 512 pour articuler la discussion et relier entre eux les fragments de 513 conversation rédigés dans des langages différents. 514 515 \end{document}