Thèse








titreThèse
page2/33
date de publication22.12.2016
taille1.3 Mb.
typeThèse
ar.21-bal.com > comptabilité > Thèse
1   2   3   4   5   6   7   8   9   ...   33

1.Introduction

1.1Une sémantique linguistique universaliste a priori pour des opérations senstexte et textesens

1.1.1Une sémantique linguistique


La définition du mot sémantique est souvent linguistique. D’après le dictionnaire Le Petit Robert (1991), c’est une « théorie visant à rendre compte des phénomènes signifiants dans le langage ». On rencontre aussi des acceptions plus larges. Dans la version non abrégée de ce dictionnaire (Le Robert 1983), c’est le « nom de diverses disciplines à caractère plus philosophique que linguistique ». Cette dernière acception ouvre sur des définitions très larges. Chez Alfred Korzybski (1933) le mot sémantique engendre le terme sémantique générale qui recouvre une « étude sociale, psychologique et logique du signe ». Le romancier A.E. Van Vogt, membre de l’Institut de Sémantique Générale, précise cette définition (1970) : « La sémantique générale traite du sens des significations. De ce fait, elle transcende et surpasse la linguistique ».

La sémantique générale vise à décrire des systèmes doués de facultés cognitives. Elle étudie l’écart entre la signification des textes et leur appropriation cognitive. Des exemples de tels systèmes comprendraient l’étude du fonctionnement d’une machine capable de jouer à un jeu consécutivement à la lecture de ses règles ou les conditions de l’invention de l’ordinateur HAL du film 2001, l’Odyssée de l’espace.

Les règles d’un jeu sont écrites en une langue donnée. HAL parle une langue. Quel rapport existe-t-il entre les textes d’une langue et l’application d’une règle de jeu ou les facultés de HAL ? Ce rapport est l’objet de la sémantique générale qui étudie le





Sens


des


significations


c-à-d

Représentation (mentale, psycho­logique), compréhension

qui est propre aux

interprétations linguistiques : sens littéraux en contexte, sens linguistiques.


Nous voyons que la sémantique générale admet comme point de départ un sens linguistique résolu. Si le projet de la sémantique générale est séduisant, il faut noter que le présupposé de résolution est audacieux : du fait de l’ambiguïté apparente du langage naturel quand il est considéré indépendamment de mécanismes de désambiguïsation supposés et non apparents, le sens linguistique ne nous est pas encore donné. C’est pourquoi notre thèse développe des mécanismes de désambiguïsation qui participent à la restitution automatique du sens linguistique.

L’ambiguïté recouvre des aspects lexicaux et syntaxiques. L’ambiguïté lexicale tient en la polysémie et en l’homonymie de la plupart des mots de la langue. La polysémie1 est, en linguistique synchronique, le caractère d'un signe qui à catégorie grammaticale constante possède plusieurs signifiés à noyau commun. Le mot abattre est polysémique quand, à partir du noyau faire tomber, il devient détruire (une chose érigée) ou couper (un arbre dressé). L’homonymie est le caractère d’un signe qui a plusieurs signifiés entièrement disjoints. Dans la phrase l’aide-comptable a sorti un bilan complet alors même que le brouillard n’a pas été validé, les mots bilan et brouillard ont des significations lexicales particulières que nous chercherons à restituer automatiquement. L’ambiguïté syntaxique tient en la difficulté de rattacher d’une manière unique les groupes d’une proposition et à associer des fonctions syntaxiques à ces rattachements. La résolution de l’ambiguïté syntaxique a pour objet la détermination de l’équivalence de deux propositions paraphrastiques d’un même sens linguistique. La restitution de la signification syntaxique conduit à produire des sens linguistiques voisins pour les énoncés l’embouteillage des liquides est effectué automatiquement par des machines spécifiques et des machines spécialisées mettent en bouteille automatiquement les liquides.

Ces tâches que nous regroupons sous le nom de restitution automatique de la signification définissent l’objet de notre sémantique linguistique qui se donne deux hypothèses fondatrices :

  • premièrement, il n’est pas possible de restituer automatiquement des significations non bruitées, c’est-à-dire uniquement et exactement les bonnes significations, dans tous les cas de figure sans disposer d’un module traitant du sens des significations (compréhension générale). Sans ce module, la restitution ne peut produire qu’un sur-ensemble des significations acceptables, toute compréhension égale par ailleurs.

  • deuxièmement, il existe des mécanismes linguistiques capables de limiter le nombre de significations linguistiques possibles. Nous décrirons les mécanismes linguistiques que nous utilisons actuellement.

1.1.2Les opérations sémantiques textesens et senstexte


La restitution automatique des significations de diverses composantes d’un énoncé linguistique met en œuvre deux types d’opérations linguistiques :

  1. Une opération qui part du texte et construit des significations à partir des composantes linguistiques : syntagme, proposition et texte. Quelque que soit la composante linguistique étudiée, nous appelons l’opération qui part du texte pour construire des significations, l’opération textesens2.

  2. Une opération qui part d’un sens linguistique et aboutit à différentes formulations linguistiques de cette signification. Nous nommons senstexte cette opération.

La dualité des opérations textesens et senstexte pourrait laisser croire en une complète indépendance des deux opérations. Une grande interdépendance des deux opérations doit au contraire être admise.

A l’évidence, senstexte dépend de textesens puisque l’entité sens n’a pas d’existence extérieure à notre propre subjectivité et que l’entité texte existe en nombre inépuisable. Montrer que textesens dépend de senstexte nécessite une réflexion plus détaillée. L’opération textesens peut aboutir pour la phrase à l’élaboration d’une structure sémantique (Ssém chez Mel’Cuk) qui serait un réseau dont « les nœuds sont étiquetés par des sémantèmes de la langue et dont les arcs représentent des relations prédicats arguments » (Mel’Cuk 1999). Si l’on souhaite l’entité sens unique pour l’ensemble des paraphrases d’une phrase, l’opération textesens met en œuvre :

  1. des opérations textesens qui effectuent :

  • au plan syntaxique,

  • une différenciation des énoncés des machines spécifiques embouteillent automatiquement les liquides et des liquides embouteillent automatiquement les machines spécifiques puisque « l’ordre des mots » de texte « est important » (Journet 1999)

  • deux représentations profondes de il a parlé de voyage avec Emma puisque « l’ordre des regroupements des mots est important » (Journet 1999)

  • au plan lexical, une restitution des significations lexicales

  1. des opérations senstexte qui effectuent :

  • au plan syntaxique,

  • un rapprochement de les chiens craignent (avoir peur ) les hommes et l’homme effraie (faire peur) aux chiens en prenant en compte la direction de la prédication (Journet 1999)

  • une même représentation de l’embouteillage s’effectue par des machines spécifiques et des machines spécifiques embouteillent

  • au plan lexical, une même représentation par réduction lexicale3 de monnaie du Japon en yen.

D’une façon générale, senstexte doit être utilisé pour dédoublonner des propositions du point de vue de leur représentation syntaxique profonde.

Parmi les opérations décrites ici dans leur interdépendance, notre thèse étudiera particulièrement l’opération senstexte de réduction lexicale et textesens de restitution des significations lexicales.

1.1.3Une sémantique universaliste a priori


Sur un plan très général, nous insisterons sur une relative indépendance du linguistique par rapport aux mécanismes de compréhension mis en jeu dans ce que Hiz (1964) a nommé une sémantique forte4 ou par rapport à ce que nous avons décrit de la sémantique générale. Cette affirmation d’indépendance du linguistique se traduit par deux caractères parfois contestés de nos orientations sémantiques.

Le premier de ces caractères est l’universalisme. Par universalisme, nous entendons fondamentalement que :

  • les unités lexicales disposent de significations indépendamment de tous leurs contextes ; ces significations hors contexte sont données par le code de chaque langue. Ce point renvoie à l’activité sémasiologique proprement dite qui, partant du signe linguistique renvoie d’autres unités linguistiques qui lui correspondent.

  • les significations ne sont pas des suites de signes linguistiques. Ce point renvoie à une sémasiologie comportant une dimension terminologique. Cette sémasiologie associe aux unités linguistiques des champs conceptuels.

  • pour chaque signification, l’ensemble des formulations est donné. Ce point renvoie à l’activité onomasiologique qui part des concepts et des champs conceptuels et retourne l’ensemble des formulations linguistiques qui lui correspondent.

  • la signification d’une unité lexicale utilisée dans un contexte présente toujours un rapport avec le sens des significations qui est élaboré « par un sujet donné dans un contexte d’énonciation donné » (Sabah 1997, pp. 91-133)

  • il existe un nombre fini d’unités lexicales et de significations à connaître pour pouvoir accéder par l’analyse des textes (comme un dictionnaire) à d’autres unités lexicales et d’autres significations.

Le deuxième de ces caractères est l’apriorisme. Par apriorisme, nous entendons fondamentalement que :

  • les contextes d’apparition des significations lexicales peuvent être décrits indépendamment de tout domaine des connaissances, de toute pragmatique et de toute application particulière

  • les contextes des significations lexicales disposent de valeurs sémantiques particulières que nous nommerons concepts

  • les concepts des contextes constituent soit des connaissances linguistiques, soit des connaissances du monde.

Par exemple, l’apriorisme permet de déclarer, sans justification, l’activité (concept) de \pêche5. Dans \pêche, les mots pêcheur, filet et prise sont semblables entre eux (bien que sur le plan des significations universalistes, ils soient très différents). Pour d’autres concepts, comme \personne, \pêcheur, \filet et \prise sont totalement différents. L’apriorisme permet d’une part, de déclarer \pêche ou \personne sans préjuger de leur utilité pour traiter d’un texte réel, d’autre part, d’admettre qu’il n’y a pas d’unité à attendre des descriptions aprioriques puisque l’unité n’existe qu’a posteriori, comme interprétation de l’expérience contenue dans un texte réel.

L’universalisme et l’apriorisme caractérisent les grandes bases de connaissances et fait leur force : l’universalisme fournit les hypothèses par les différentes significations connues, l’apriorisme procure des clés de résolution au moyen des associations proposées par les concepts. Cependant, des auteurs qui s’intéressent à l’opération textesens rejettent hors du champ de la sémantique linguistique les qualificatifs universaliste et a priori. Par exemple, Rastier (1987, p.33) note :

Formulons à présent une définition du sème ... que nous empruntons à Pottier : « le sème6 est le trait distinctif sémantique d’un sémème7, relativement à un petit ensemble de termes réellement disponibles et vraisemblablement utilisables chez le locuteur dans une circonstance donnée de communication » (1980a, p. 169) . Elle ne peut que chagriner les tenants d’une sémantique universaliste a priori.

Pourtant il semble bien que cette association de l’universalisme et de l’apriorisme soit nécessaire si l’on veut un jour pouvoir calculer le sens de la phrase « toute simple » (Sabah 1997) je reviendrai. Pour cette phrase, Robert Martin (1983) cité par Sabah (1997) évalue pragmatiquement le sens de promesse à la fin d’une visite médicale, celui de compliment de la part d’un client, d’avertissement de la part d’un agent s’adressant à un contrevenant mal garé, de consolation de la part d’un soldat qui part au front. Pour cette phrase, étudions ici les hypothèses d’universalisme et d’apriorisme.

Cette étude doit-elle nous conduire à réfuter l’intérêt d’une base universaliste ? Supposons d’abord que l’on accepte la réfutation de l’universalisme. Dans ce cas, je reviendrai est absent du dictionnaire. De même, une expression synonymique comme je repasserai est également exclue. Fondamentalement, je reviendrai et je repasserai ont une signification commune que l’on peut formuler comme suit : \ce que l’on dit en prenant congé d’une personne en voulant lui exprimer que l’on pense la revoir bientôt. On peut énumérer une liste d’expressions françaises susceptibles de prendre cette valeur. Ces expressions sont par exemple à bientôt, à demain, à tout à l’heure, à plus tard, à plus, à +, à la prochaine fois, à la prochaine8… Or nombre de ces expressions sont des entrées ou des sous-entrées de dictionnaires de français contemporain. Selon quels critères à bientôt, à plus ou à demain seraient-ils des entrées du dictionnaire de langue et je repasserai ou je reviendrai n’en seraient-ils pas ? Parmi les critères, le critère le plus courant est celui de la calculabilité de la signification : une expression appartient au dictionnaire si sa signification ne peut pas être déduite de l’analyse des significations de ces constituants. On peut débattre de l’application de ce critère à chacun des vocables que nous venons de citer. Du fait que l’on pourrait fournir une explication en terme de constituants9 de la signification de chacun de ces vocables, il est possible de défendre le retrait de chacune de ces expressions du dictionnaire. Pour conserver son rôle d’accès à la langue, en retour de cette suppression, le dictionnaire devrait alors fournir les clés d’interprétation des expressions soustraites. Cela est certainement possible au prix d’une refonte complète des dictionnaires et surtout d’un abaissement important de leur accessibilité et de leur lisibilité. Mais le rôle du dictionnaire ne se limite pas à l’explication de la signification (opération textesens). Le dictionnaire doit aussi renseigner sur l’usage (opération senstexte). Si l’on peut imaginer que l’explication des parties puisse rendre compte de la valeur d’une expression rencontrée (opération textesens), on ne peut concevoir que d’un énoncé des parties puisse naître seulement les expressions usuelles d’une langue à un moment donné (opération senstexte). Ainsi, reporter l’usage dans un répertoire (dictionnaire) c’est nécessairement consacrer l’entrée dans le dictionnaire de vocables dont on peut concevoir que leur signification globale se déduit de la signification de leurs constituants. De là vient que à bientôt, à demain, à tout à l’heure, à plus tard, à plus... appartiennent nécessairement à la nomenclature du dictionnaire. Dans cette mesure, il devient impossible de réfuter l’intérêt et même la nécessité d’une base universaliste. Pour notre exemple je reviendrai, comme il est aussi d’usage d’employer cette expression pour \ce que l’on dit en prenant congé d’une personne en voulant lui exprimer que l’on pense la revoir bientôt, il devient naturel que l’expression je reviendrai (ou une quelconque représentation qui aboutirait à je reviendrai) appartienne également à la nomenclature. Dans le dictionnaire universaliste, comme pour chaque signification l’ensemble des formulations est donnée, le concept \ce que l’on dit en prenant congé d’une personne en voulant lui exprimer que l’on pense la revoir bientôt comprend nécessairement l’ensemble des expressions que nous venons de recenser à moins d’accepter de ne pas refléter l’usage.

Considérons maintenant l’apriorisme. Cette étude doit-elle nous conduire à réfuter l’intérêt d’une base apriorique ? Nous admettons désormais que les expressions je reviendrai ou à bientôt appartiennent au dictionnaire universaliste. Ces expressions ont en commun le concept \ce que l’on dit en prenant congé d’une personne en voulant lui exprimer que l’on pense la revoir bientôt. L’apriorisme propose que l’usage d’un mot est conditionné par des contextes d’apparition qui peuvent être donnés indépendamment de tout domaine de connaissances et de toute situation pragmatique identifiée fournie par une application. Ainsi, l’on se demande dans quel cas on utilise l’une des expressions qui appartiennent à notre concept. Pour la partie \ce que l’on dit en prenant congé d’une personne, le contexte de prendre congé est donné. Il reste à justifier les conditions d’emploi de \...en voulant lui exprimer que l’on pense la revoir bientôt. Il s’agit d’une promesse plus ou moins marquée d’une nouvelle rencontre future. Plus généralement, il s’agit d’une promesse d’une réalisation future d’un événement. Il nous semble que d’une façon définitoire toute promesse d’une réalisation future d’un événement porte une menace ou une espérance, une valeur positive ou négative, par exemple quelque chose qui pourra faire office de consolation ou de compliment pour l’immédiat, d’avertissement c’est-à-dire d’encouragement à cesser ou d’encouragement à continuer pour le futur. C’est là précisément le résultat de l’analyse de Martin. Ainsi, plutôt que de contribuer à réfuter l’apriorisme, cette analyse aboutit à une affirmation de la nécessité des descriptions aprioriques des contextes d’apparition des expressions linguistiques. En conclusion, nous suggérons que le sens pragmatique d’un énoncé est pleinement donné par ses significations lexicales si les descriptions aprioriques, qui permettent de sélectionner en contexte certains concepts plutôt que d’autres, sont complètes.

Arrivé à ce point, nous pouvons nous demander si notre sémantique universaliste et apriorique appartient davantage à la sémantique générale et est donc en-dehors du champ linguistique ou si, au contraire, elle appartient au champ linguistique. Rappelons que notre projet consiste essentiellement à déterminer la signification des mots en contexte. Comme Wilks (1999), nous nous posons la question « Est-ce que la désambiguïsation des mots-sens est juste une tâche supplémentaire du traitement automatique des langues ? »10. Pour notre exemple, cette question devient : « Est-ce que la désambiguïsation de je reviendrai est juste une tâche particulière du traitement automatique des langues ? ». L’universalisme à travers la nécessité de répertorier l’usage a consacré (directement ou par modèles) je reviendrai comme mot. L’apriorisme par induction des significations a conduit à déclarer les potentialités de promesse ou de menace sans nous imposer l’énumération de l’ensemble des situations pragmatiques possibles. Finalement nous répondons positivement à la question « Est-ce que la désambiguïsation de je reviendrai est juste une tâche particulière du traitement automatique des langues ? ». Et avec Wilks nous soutenons que la désambiguïsation des mots-sens est pour l’essentiel juste une tâche supplémentaire du traitement automatique des langues. Comme la description des mots-sens appartient à la sémantique linguistique, nous concluons que notre sémantique universaliste et apriorique appartient au champ linguistique et non à la sémantique générale.

1.1.4Quelques problèmes posés par l’universalisme et l’apriorisme


Les trois principales objections posées à l’universalisme et à l’apriorisme sont les suivantes :

  1. il est permis de douter qu’un système artificiel doté hors domaine d’un grand nombre de descriptions universalistes puisse retrouver grâce à des descriptions données a priori les bons éléments de significations lexicales.

  2. il est possible de croire qu’un nombre important des descriptions contextuelles embrouille davantage le système qu’il ne l’aide à résoudre les ambiguïtés.

  3. en supposant que ni l’universalisme ni l’apriorisme ne sont des pièges pour un système automatique, il reste que nombre de personnes doutent que l’on puisse construire, automatiquement ou manuellement, de grandes bases de connaissances.

Les deux premières objections constituent le cœur des critiques formulées contre les grandes bases de connaissances : un système automatique ne peut pas réaliser l’idéal universel de la déclaration de toutes les significations possibles d’une part, sélectionner les sèmes pertinents d’autre part, sans disposer de mécanismes de compréhension profonde. Pour ces deux objections, en reprenant la tournure de phrase de Todorov (cité dans Rastier 1987, p. 30), nous formulons : nous ne disposons pas de critères formels pour délimiter les sèmes automatiquement. La sémantique componentielle11 a choisi de croire qu’un jour on arriverait à trouver ce critère et pour l’instant agit comme si cela était fait. Du fait même qu’il est malaisé de délimiter les sèmes automatiquement, il est urgent de noter, référencer, mémoriser et mettre en système les sèmes que l’on a cru découvrir par l’étude.

La troisième objection est clairement formulée par Victorri (1998) :

Les projets grandioses de constitution de vastes bases encyclopédiques, comme le projet CYC, ont semble-t-il fait long feu. La plupart des chercheurs en Intelligence Artificielle reconnaissent aujourd'hui qu’il n'est pas réaliste d'envisager, dans un avenir prévisible en tout cas, des systèmes généralistes capables de modéliser l’ensemble des connaissances de base que les humains utilisent dans leurs conversations quotidiennes.

Il faut toutefois noter que le texte de Victorri cite la constitution de bases encyclopédiques et donc concerne davantage la sémantique générale que la sémantique au plan linguistique. Il n’en reste pas moins vrai que l’opinion trouve suspecte les grandes bases de connaissances linguistico sémantiques et que cette opinion contribue à ralentir les développements de ces bases. Malgré l’opinion répandue, nous décrirons ici une grande base de connaissances linguistico sémantiques et ses principales compétences actuelles en terme de traitement automatique.
1   2   3   4   5   6   7   8   9   ...   33

similaire:

Thèse iconThèse soutenue publiquement par Sang-Ha suh le 10 Juillet 2006
«avec projection», de cette thèse aux membres du Conseil scientifique et à leurs expliquer pourquoi cette thèse ne devait pas être...

Thèse iconThèse soutenue publiquement par Sang-Ha S. le 10 Juillet 2006 Le...
«avec projection», de cette thèse aux membres du Conseil scientifique et à leurs expliquer pourquoi cette thèse ne méritait pas d’être...

Thèse iconThèse Sommaire

Thèse iconTHÈse de doctorat

Thèse iconSujet de thèse

Thèse iconThèse de III

Thèse iconTHÈse présentée

Thèse iconRésumé de thèse

Thèse iconThèse 4 I. Introduction

Thèse iconRapport d'étape de thèse








Tous droits réservés. Copyright © 2016
contacts
ar.21-bal.com