Concepts, actions et outils linguistiques








télécharger 4.44 Mb.
titreConcepts, actions et outils linguistiques
page19/74
date de publication21.01.2020
taille4.44 Mb.
typeDocumentos
ar.21-bal.com > droit > Documentos
1   ...   15   16   17   18   19   20   21   22   ...   74

Dictionnaire électronique français-espagnol-catalan-arabe des noms des professions et des métiers83


Xavier Blanco


Université Autonome de Barcelona

Douha Lajmi


Université de la Manouba
Résumé : au sein des projects d’action de recherche du réseau en Lexicologie, Terminologie et Traduction de l’AUF, l’Université Autonome de Barcelone et l’Université de la Mannouba ont entrepris l’élaboration d’un dictionnaire électronique français-espagnol-catalan-arabe des noms des professions et des métiers. Nous présentons la méthodologie d’élaboration de ce dictionnaire ainsi que quelques-unes de ses applications.

Mots-clés : dictionnaire électronique, noms de profession, traduction, lexicomatique, grammaires locales
1. INTRODUCTION

Le lexique et la grammaire des noms de profession est un sujet qui semble particulièrement apte pour intégrer des recherches unissant un intérêt linguistique à un intérêt social. En effet, d’un côté, la bibliographie sur le domaine des noms de profession considérés d’un point de vue linguistique est encore relativement réduite et les outils disponibles semblent limités à des langages documentaires qui présentent des modalités d’utilisation peu intuitives pour le grand public.

D’un autre côté, Internet est devenu le théâtre d’une énorme activité autour de la recherche d’emploi (nationale et internationale). Or, la technologie employée par les principaux acteurs de ce domaine sur le Web ne semble pas inclure de modules linguistiques spécifiques permettant d’améliorer de manière sensible les performances des sites en matière de récupération et filtrage de l’information.

Le dictionnaire que nous sommes en train d’élaborer vise à rendre compte de l’ensemble des unités lexicales désignant des noms de professions et de métiers dans les quatre langues considérées (arabe tunisien, catalan, espagnol, français). Il devrait permettre, entre d’autres applications, d’orienter l’usager pendant la recherche d’un emploi à partir de capacités de paraphrase intra-linguistique (p. ex. étant donnée une dénomination de profession ou de métier en langue courante, trouver toutes les dénominations officielles du poste de travail concerné) et inter-linguistique (p. ex. en partant d’une dénomination en langue étrangère, trouver la dénomination officielle en langue maternelle, le domaine d’activité et, éventuellement, des équivalences en langue courante). Plusieurs sous-classes syntactico-sémantiques à l’intérieur des noms de profession sont distinguées.

Nous présentons ci-dessous plusieurs des particularités du dictionnaire électronique et des grammaires locales qu’il permet d’engendrer. L’essentiel des points de vue et des exemples présentés ont été exposés aussi dans Blanco (sous presse), bien que sous une perspective orientée à l’exploitation de l’outil décrit dans l’enseignement/apprentissage des langues.
2. LE DICTIONNAIRE ÉLECTRONIQUE DES NOMS DE PROFESSION
2.1. Les sources documentaires

Il existe différents langages documentaires présentant un inventaire des noms de professions en français et/ou en espagnol, comme la Classification Internationale Type des Professions (gérée par l’Organisation internationale du travail) qui comporte environ 550 libellés de groupes de professionnels, distribués en quatre niveaux de classement : la Clasificación Nacional de Ocupaciones de l’Instituto Nacional de Empleo (INEM, Espagne) avec presque 4 000 noms de professions ; le Répertoire Opérationnel des Métiers et des Emplois de l’Agence Nationale pour l’Emploi (ANPE, France), avec 10 000 appellations de métiers et emplois, ou la Classification Nationale des Professions du Gouvernement du Canada avec l’important chiffre de 30 000 appellations d’emploi. Des ressources semblables existent pour l’arabe (e.g. Agence tunisienne pour l’emploi) et le catalan (Classificació catalan d’ocupacions, CCO).

Il va de soi que ces ressources doivent être considérées lors de l’élaboration de dictionnaires électroniques, car elles constituent un fonds important de matériaux lexicaux. Elles ont d’ailleurs un intérêt intrinsèque pour de possibles applications dans la mesure où elles représentent un point de référence officiel sur la terminologie de l’emploi. Il importe cependant de souligner qu’un langage documentaire n’est pas un dictionnaire électronique, car les descripteurs ne correspondent pas à des entrées lexicographiques, même si dans certains cas ils peuvent coïncider avec des entrées, et qu’ils ne comportent pas de microstructure.

Dans le cas de langages comportant des relations hiérarchiques, ces relations ne sont pas fondées sur le comportement syntactico-sémantique des unités lexicales et ne sont donc pas directement exploitables en traitement automatique des langues, bien qu’elles puissent constituer une orientation pour la mise en relief de groupements syntactico-sémantiques pertinents en langue de spécialité. Dans nombre de cas, les relations hiérarchiques de type documentaire constituent un raccourci pratique pour le classement par domaines et sous-domaines ainsi que pour l’établissement de réseaux de variantes et/ou synonymes.

Par ailleurs, il va sans dire que l’Internet est une source de première magnitude quant aux offres et demandes d’emploi et de très nombreux sites spécialisés dans la recherche d’emploi sont à considérer pour le dépouillement lexical (cf. Buvet et Foucou 2000).
2.2. Macrostructure et microstructure du dictionnaire électronique

Nous estimons qu’un inventaire assez complet des noms de profession devrait contenir non moins de 500 lemmes correspondant à des noms simples de haute plausibilité (niveau 1)84 pour chacune des langues considérées. L’ajout des noms simples de moindre plausibilité conduit facilement à un inventaire de plus de 2 000 termes et peut, probablement, être incrémenté de façon très sensible en prenant en considération des variantes diastratiques et diatopiques.

Quant aux noms composés (avocat de l’État, directeur commercial), leur nombre oscille beaucoup en fontion des capacités du système à représenter des schémas productifs en intension (moyennant, par exemple, des moules lexicaux comme marchand de N
, éléveur de N)
(cf. Le Pesant, 2003 et Mejri, 1997). Ainsi, par exemple, le dictionnaire dont nous disposons à l’heure actuelle contemple environ une centaine de composés de type profesor de N, et trois schémas productifs, sous forme d’automates à états finis, qui rendent compte de combinaisons possibles mais moins lexicalisées comme :

- profesor de  : profesor de demografía, profesor de epidemiología

- profesor de  : profesor de guaraní, profesor de finlandés

- profesor de  : profesor de clavicordio, profesor de arpa

Cette organisation des dictionnaires, bien que présentant des frontières floues entre les unités lexicales décrites en extension (comme des lemmes) et les composés disponibles mais non réalisés, nous semble correspondre à la réalité dans la mesure où la perception d’une suite comme professseur d’anglais est tout à fait différente de celle d’une suite comme professeur d’ourdou par exemple. Même d’un point de vue strictement applicatif, la typologie de contrat d’un professeur de langues en Espagne présente 18 dénominations correspondantes à 16 langues, les langues classiques (latin et grec ancien) et le libellé générique (non correspondant à une unité lexicale) : profesor de idiomas no recogidos en otro epígrafe. Signalons aussi que nous ne considérons pas d’autres schémas moins productifs (profesor de <établissement d’enseignement>, profesor de ), dans la mesure où ils peuvent être décrits de façon satisfaisante en extension.

Toutefois, les descriptions par intension étant informatiquement coûteuses en termes de temps de traitement, et compte tenu du fait qu’il existe bon nombre de composés non susceptibles d’être engendrés par des schémas, il faut compter sur une liste en extension de non moins de 10 000 lemmes composés pour les noms de profession.

Le modèle de microstructure dont nous nous servons est, pour l’essentiel, celui qui est à la base des travaux du LLI (Laboratoire de Linguistique Informatique, Paris 13), décrit dans des publications comme (Gross, 1999; Gross et Guenthner, 2002). Tout d’abord, les lemmes doivent recevoir une description minimale correspondant à leur catégorie grammaticale et permettant leur flexion automatique. Le trait syntactico-sémantique correspondant aux noms de profession est toujours humain et la classe syntactico-sémantique correspond, par définition, aux
(Nhum
).
Cependant, il existe une grande variété de domaines de spécialité. Le croisement de la classe des noms de profession avec les différents domaines, décrits d’après (Buvet et Mathieu-Colas, 1999), est cruciale pour l’interprétation sémantique des lemmes. En fait, il s’agit d’une classe très particulière par rapport aux domaines, à cause de paraphrases (cf. en français de la branche de l’enseignement, de l’hôtellerie) comme :

Jean travaille comme (avocat, médecin...).

Jean exerce (le barreau, la médecine...).

Jean travaille dans le domaine (du droit, de la médecine...).

D’autre part, les noms de profession présentent, en plus de leur syntaxe commune, des syntaxes tout à fait différentes selon leurs domaines respectifs. Ainsi, par exemple, un nom comme cuisinier et ses (quasi) synonymes sont des sujets appropriés à environ 150 verbes spécifiques du domaine culinaire : aciduler, ailler, assaisoner, braiser, condimenter... Il est cependant important de souligner que, dans beaucoup de ces cas, la sélection d’un nom de profession n’est qu’optionnelle par rapport à celle d’un humain d’un autre type.

Il faut également établir des réseaux de variantes et des synonymes, qui permettent de regrouper au besoin les entrées présentant à peu près le même signifié. Il est important aussi qu’un champ du dictionnaire renseigne sur le niveau diastratique des entrées. Ainsi les formes espagnoles marmitón, fregador, fregaplatos, friegaplatos, limpiador, limpiaplatos, platero (Fr : marmiton) seront marquées comme des appellations familières de la profession auxiliar de cocina, tout comme les formes paleta ou canguro seront étiquetées comme des dénomination informelles de albañil (Fr : maçon) et cuidador (de niños) (Fr : baby-sitter) respectivement85. Les variations diatopiques sont aussi à considérer. Ainsi lustrabotas (Fr : cireur de chaussures) est employé en Amérique latine tandis qu’en Espagne la forme habituelle est limpiabotas.

Finalement, on sélectionne des équivalences de traduction vers les langues cibles considérées. Il est important de souligner que ces traductions n’ont un sens que dans la mesure où elles pointent vers des entrées d’un dictionnaire électronique monolingue de la langue considérée (Blanco, 2001).
3. UNE GRAMMAIRE LOCALE DES NOMS DE PROFESSION

La notion de prédicat approprié (e.g. engager, embaucher, travailler comme... pour les noms de
) nous mène à l’établissement de grammaires locales pour chacune des classes syntactico-sémantiques considérées. Il s’agit de dresser un inventaire des prédicats qui sélectionnent de façon appropriée les noms de profession. La grammaire locale des
découle alors des contraintes représentées dans le dictionnaire, dans la mesure où la description de chaque prédicat comporte l’indication du nombre et de la nature sémantique de ses arguments, d’une part, et d’une série de propriétés transformationnelles d’autre part.

La façon la plus simple d’avoir, en même temps, un entourage de travail convivial pour le lexicographe et un moyen agile de vérifier la pertinence des descriptions linguistiques sur des corpora nous semble être le travail sous forme de tables, en format de base de données (Mathieu-Colas, 2002). Les positions argumentales des prédicats sont arborées d’un trait syntactico-sémantique et/ou d’une classe syntactico-sémantique ou classe d’objets. Quant aux propriétés transformationnelles, elles sont marquées de façon binaire (+ ou –).

Ainsi, le lexicographe code des lignes comme :

trabajar\N0 :hum\P1 :como,de\N1 :hum
\P2 :para\N2 :hum\Fr : travailler


Ensuite, on indiquera la possibilité de transformations, comme par exemple la paraphrase de para N1hum par en N1hum à condition que N1 corresponde à un humain collectif  :

Juan trabaja para Iberia como piloto =

Juan trabaja en Iberia como piloto

Jean travaille pour Iberia comme pilote =

Jean travaille (à, chez) Iberia comme pilote

Juan trabaja para Pedro como secretario =

*Juan trabaja en Pedro como secretario

Jean travaille pour Pierre comme secrétaire =

Jean travaille (*à, #chez) Pierre comme secrétaire86

Bien entendu, beaucoup d’autres phénomènes resteraient à décrire. Ainsi, par exemple, certains verbes admettent un usage intransitif qui favorise leur interprétation en tant que désignations d’activités professionnelles : Jean enseigne (il est enseignant), Jean joue samedi (il est musicien), etc.

De plus, beaucoup de noms locatifs sont corrélés à des prédicats d’activité professionnelle. En effet, des séquences comme aller (au bureau, à l’usine) ne sont pas uniquement interprétables comme un verbe de mouvement et une cible : souvent, elles impliquent une activité professionnelle. Les noms de profession correspondants sont présents en tant qu’arguments internes du locatif : les employés du bureau, les ouvriers de l’usine… (Le Pesant, 2000), ce qui explique des phénomènes de co-référence comme :

Jean entra dans le bloc opératoire. Le chirurgien le salua.

Par rapport à :

Jean entra dans le bloc opératoire. (*Le, Un) épicier le salua.

De la même façon, des séquences comme aller chez le (coiffeur, médecin) seront interprétées comme “solliciter les services” du coiffeur ou du médecin. Le possessif a aussi une interprétation particulière avec les noms de profession (mon médecin) ou de noms locatifs impliquant une activité professionnelle (ma boulangerie).
4. VERS UN « PARADIGME DE FLEXION » DES SCHÉMAS D’ARGUMENTS

Il semblerait que les grammaires locales doivent être complétées par un système de paraphrases permettant de rendre compte de toutes les possibilités réelles d’actualisation et de linéarisation d’un schéma d’arguments donné. Il serait donc nécessaire de dresser un inventaire d’actualisations/linéarisations possibles et de les coder pour chaque prédicat.

Mel’cuk (1992) offre un système formalisé de règles de paraphrase. D’autre part, les recherches du même auteur en morphologie l’ont amené à dresser une typologie de significations grammaticales (Mel’cuk, 1994) qui nous semble réutilisable du point de vue de l’actualisation par de moyens autres que morphologiques, par exemple, pour coder des valeurs d’extensions de verbes supports (Blanco et Buvet, sous presse).

À titre d’exemple, nous essaierons de dresser un début de ce qui pourrait être un « paradigme de flexion » d’un schéma d’arguments. Prenons la forme espagnole contratar (embaucher). Son schéma d’arguments pourrait être représenté comme suit :

Contratar (Nhum, Nhum, Nhum
, Ntps)


Une phrase-type87 pourrait être :

Seat contrata a Juan como ingeniero por 3 meses.

Seat embauche Jean comme ingénieur pour 3 mois.

On admettra sans difficulté que différentes actualisations sont possibles concernant le temps absolu, le temps relatif, la résultativité, le mode ou l’aspect :

- temps absolu :

Seat (contrató, contratará) a Juan como ingeniero por 3 meses.

Seat (embauche, embauchera) Jean comme ingénieur pour 3 mois.

- temps relatif :

Seat (había contratado, habrá contratado) a Juan como ingeniero pour 3 meses.

Seat (avait embauché, aura embauché) Jean comme ingénieur pour 3 mois.

- résultativité :

Juan está contratado (por Seat) como ingeniero por 3 meses.

Jean est embauché (par Seat) comme ingénieur pour 3 mois.

- mode :

Seat (contrataría, habría contratado) a Juan como ingeniero por 3 meses.

Seat (embaucherait, aurait embauché) Jean comme ingénieur pour 3 mois.

- aspect :

Seat (acaba de contratar, contrata de nuevo) a Juan como ingeniero por 3 meses.

Seat (vient d’embaucher, a embauché à nouveau) Jean comme ingénieur pour 3 mois.

Ce type d’actualisations est obtenu principalement grâce aux désinences flexionnelles du verbe. Cependant, bien d’autres actualisations possibles feraient intervenir d’autres moyens linguistiques. Considérons les unites suivantes qui présentent des variations quant à la polarité, l’interrogativité, la communicativité, la voix, la réactivité, l’évidentialité, la modalité ou la factitivité :

- polarité :

Seat no ha contratado a Juan como ingeniero por 3 meses 88.

Seat n’a pas embauché Jean comme ingénieur pour 3 mois.

- interrogativité :

¿ Seat ha contratado a Juan como ingeniero por 3 meses ?

Seat a-t-elle embauché Jean comme ingénieur pour 3 mois ?

- communicativité :

A Juan, Seat lo ha contratado como ingeniero por 3 meses.

C’est Jean que Seat a embauché comme ingénieur pour 3 mois.

- voix :

Juan ha sido contratado como ingeniero (por 3 meses) por Seat.

Jean a été embauché comme ingénieur (pour 3 mois) par Seat.

- réactivité :

¡ Seat ha contratado a Juan como ingeniero por 3 meses !

Seat a embauché Jean comme ingénieur pour 3 mois !

- évidentialité :

Dicen que Seat ha contratado a Juan como ingeniero por 3 meses.

(On prétend que) Seat aurait embauché Jean comme ingénieur pour 3 mois.

- modalité :

Seat quiere contratar a Juan como ingeniero por 3 meses.

Seat veut embaucher Jean comme ingénieur pour 3 mois.

- factitivité :

Pedro ha hecho que Seat contrate a Juan como ingeniero por 3 meses.

Pierre a fait que Seat embauche Jean comme ingénieur pour 3 mois.

Il existe, par ailleurs, une relation paraphrastique évidente entre :

Seat contrata a Juan como ingeniero por 3 meses.

Seat embauche Jean comme ingénieur pour 3 mois.

Seat le hace un contrato de ingeniero a Juan por 3 meses.

Seat fait un contrat de 3 mois à Jean (comme ingénieur).

Or, le nom prédicatif contrato admet différents verbes supports89 :

Juan (firma, concluye, formaliza) un contrato de ingeniero con Seat por 3 meses.

Jean signe un contrat comme ingénieur avec Seat pour 3 mois.

Juan está (en, bajo) contrato con Seat como ingeniero por 3 meses.

Jean est (en, sous) contrat avec Seat comme ingénieur pour 3 mois.

Juan tiene un contrato con Seat como ingeniero por 3 meses.

Jean a un contrat avec Seat comme ingénieur pour 3 mois.

Mis à part les actualisations de base (temps, aspect, voix…), les verbes supports peuvent véhiculer bien d’autres actualisations, comme les phases inchoative, continuative et terminative :

- inchoative :

Juan ha (obtenido, conseguido) un contrato con Seat como ingeniero por 3 meses.

Jean a (obtenu, décroché) un contrat avec Seat comme ingénieur pour 3 mois.

- continuative :

Seat mantiene a Juan en contrato (como ingeniero) por 3 meses.

Seat garde Jean sous contrat (en tant qu’ingénieur) pour 3 mois.

- terminative :

Juan termina su contrato con Seat (como ingeniero por 3 meses).

Jean finit son contrat avec Seat (comme ingénieur pendant 3 mois).

ainsi que la causativité (et anticausativité) :

- causativité :

Esto le valió a Juan un contrato de ingeniero con Seat por 3 meses.

Cela a valu à Jean un contrat d’ingénieur avec Seat pour 3 mois.

- anticausativité :

Seat (anula, rescinde) el contrato de Juan como ingeniero.

Seat (annule, résilie) le contrat de Jean comme ingénieur.

L’actualisation du nom prédicatif comprend aussi l’évaluativité, la détermination, la comparaison :

- évaluativité :

Juan firma un (supercontrato, contratillo, contrato leonino, contrato en tiempo y forma) de ingeniero con Seat por 3 meses.

Jean signe un (supercontrat, contrat de merde, contrat léonin, contrat en bonne et due forme) comme ingénieur chez Seat pour 3 mois.

- détermination :

Juan firma (este, un, cierto) contrato de ingeniero con Seat.

Jean signe (ce, un, un certain) contrat comme ingénieur chez Seat 90.

- comparaison :

Juan firma con Seat el mismo contrato de ingeniero que…

Jean signe avec Seat le même contrat d’ingénieur que…

Des effacements et des linéarisations variés sont également possibles :

Seat y Juan acuerdan por contrato que...

(Seat et Jean) conviennent par contrat que...

El contrato de ingeniero que Juan ha firmado con Seat por 3 meses...

Le contrat d’ingénieur que Jean a signé avec Seat pour 3 mois...

Su contrato de ingeniero con Seat por 3 meses...

Son contrat d’ingénieur avec Seat pour 3 mois...

La (existencia, ausencia, presencia) de un contrato de ingeniero con Seat...

La (existence, absence, présence) d’un contrat d’ingénieur avec Seat...

Bien entendu, cela n’épuise pas du tout les possibilités d’actualisation :

Juan ha (cumplido, inclumplido) su contrato con Seat.

Jean a (rempli, rompu) son contrat avec Seat.91

Es posible que Juan firme un contrato de ingeniero con Seat por 3 meses.

Il est possible que Jean signe un contrat d’ingénieur avec Seat pour 3 mois.

El (posible, supuesto) contrato de ingeniero de Juan con Seat...

Le (possible, supposé) contrat d’ingénieur de Jean avec Seat...

El, (llamémoslo, por así decirlo) contrato de ingeniero de Juan con Seat...

Le prétendu contrat d’ingénieur de Jean avec Seat...

Il importe cependant de distinguer entre l’actualisation et l’adjonction de prédicats de deuxième ordre (qui s’appliquent eux-mêmes sur le prédicat contrato) :

Juan reconoce que firmó un contrato como ingeniero con Seat.

Jean admet qu’il a signé un contrat comme ingénieur avec Seat.

Seat examina el contrato que firmó con Juan.

Seat examine le contrat qu’elle a signé avec Jean.

L’établissement de paraphrases comme celles présentées ci-dessus revient, en quelque sorte, à « fléchir » un schéma d’arguments à partir de différents types d’actualisation et linéarisation possibles. Nous pensons que, afin d’obtenir une bonne couverture des réalisations possibles pour un schéma d’arguments donné, il faut tenir compte d’au moins une cinquantaine de types d’actualisation/linéarisation, comportant non moins de 150 significations grammaticales susceptibles d’être exprimées. Le nombre de réalisations possibles d’un schéma d’arguments (sans compter le changement des variables correspondant aux arguments et les insertions possibles) serait donc de milliers, voire de dizaines de milliers de séquences... mais il importe de souligner qu’un telle liste peut être dressée et qu’il est donc possible pour un système de traitement automatique du langage naturel de ramener à un schéma d’arguments donné toute réalisation possible en surface dudit schéma et, donc, de simuler la compréhension de la sémantique lexicale d’une phrase simple.

5. À PROPOS DE LA TRADUCTION

Il y aurait lieu de distinguer trois niveaux de traduction92 : l’équivalent de traduction, la traduction à proprement parler et le calcul des valeurs grammaticales. L’équivalent de traduction est une question de type lexicographique. Une fois déterminé l’ensemble de lemmes pertinents, le lexicographe doit s’efforcer d’en trouver les équivalents en langue cible. Chaque lemme sera associé à un seul équivalent de traduction dont la forme devra être vérifiée dans des corpora. Ainsi, on choisira, comme équivalent de contrato indefinido, contrat à durée indéterminée, car tout semble indiquer qu’il s’agit de la forme la plus usitée en français face au calque utilisé dans certaines traductions de l’espagnol : # contrat à durée indéfinie.

La possibilité d’effectuer des paraphrases et, a fortiori, une traduction qui ne soit pas un transfert strict de formes dépend de la capacité d’un système pour identifier des schémas d’arguments. Ainsi, la reconnaissance de la forme engager elle-même ne nous permet de procéder ni à des paraphrases ni à des traductions dans la mesure où le verbe engager est ambigu en français. En effet, on pourrait isoler une bonne dizaine d’emplois correspondant à des phrases comme :

Jean a engagé la clé dans la serrure.

Jean a engagé beaucoup d’argent dans cette affaire.

Jean a engagé sa montre au Mont-de-Piété.

etc.

Cependant, il est clair qu’il s’agit d’un verbe synonyme de recruter, embaucher dans des phrases comme :

IBM a engagé un nouveau programmeur.

Le fait d’avoir un objet direct correspondant à un nom de profession nous permet, donc, d’identifier un des emplois d’engager. D’autre part, si l’on observe l’intersection des objets directs d’engager, embaucher et recruter, on constatera qu’elle permet d’isoler la notion sémantique de nom de profession. On dira, à la suite des travaux de Gaston Gross, que engager, embaucher et recruter sont des opérateurs appropriés à la classe d’objets des
.

Des observations plus spécifiques sont aussi possibles, voire nécessaires. Ainsi, par exemple, on traduira recruter par reclutar uniquement quand il s’agira du domaine militaire. Dans le cas contraire, recruter sera traduit, de préférence, par contratar. De la même façon, engager sera traduit de préférence par fichar dans le domaine Sport :

Mon équipe a engagé un joueur lithuanien.

Mi equipo ha fichado un jugador lituano.

Les remarques ci-dessus ont à voir avec la désambiguïsation de formes, sujet bien connu. Nous avons souligné qu’il est nécessaire de désambiguïser les formes avant de traduire, ce qui revient à dire qu’il faut traduire des schémas d’arguments et non pas des formes isolées. La consultation du dictionnaire bilingue (étape de transfert) doit donc se faire sous condition d’avoir au préalable identifié les formes comme faisant partie d’une structure (ce qui est encore plus évident dans le cas des formes figées).

Bien entendu, cela ne permet pas toujours de régler les problèmes de traduction. Ainsi, par exemple, il est fort difficile de formaliser des intuitions de sens du type embaucher (ouvriers) vs engager (employés, artistes) et la consultation de corpora ne permet pas de trancher la question de façon nette. Un cas proche, en espagnol, serait ejercer, que l’on serait tenté de limiter aux professions libérales. Cependant, d’une part de nombreux exemples semblent démentir cette intuition et, d’autre part, il est justement difficile de trouver de critères strictement linguistiques pour caractériser les professions libérales.

Les valeurs de sémantique lexicale ne sont pas les seules dont on doive rendre compte lors de la traduction. En effet, comme on l’a vu ci-dessus, les schémas d’arguments présentent un paradigme de valeurs sémantiques grammaticales qu’il faut considérer. Il est indispensable d’être en mesure de transposer les sens grammaticaux véhiculés par la phrase. Ces sens grammaticaux ne peuvent pas être « traduits » à proprement parler, de la même façon que l’on ne tente pas de « traduire », par exemple, les différents temps et modes d’une verbe donné, mais uniquement le lemme (qui est ensuite fléchi en langue d’arrivée). Les sens grammaticaux doivent être générés à partir des unités lexicales en langue cible qui auront été choisies comme équivalents de traduction.

Or, pour être en mesure d’effectuer ce calcul, il est indispensable de disposer d’un système d’étiquetage qui capture l’information présente en langue de départ afin qu’elle soit considérée en entrée du module de langue cible. Ce système revient alors à une sorte d’interlangue grammaticale qui exige l’établissement préalable d’un inventaire formalisé de sens grammaticaux. Les significations grammaticales pouvant adopter plusieurs formes (lexème, morphème, élément suprasegmental, opération syntaxique), il devrait être possible, par exemple, de faire le lien entre une certaine valeur du conditionnel français (le « citatif ») et des périphrases espagnoles comme Se dice que... (Se dice que Juan cometió ese crimen = Jean aurait commis ce crime) ou entre un évaluatif lexical et un intonème (Juan tiene una paciencia de santo = Jean a une patience !). Le fait de disposer d’un inventaire de « sens » grammaticaux et de pouvoir les coder devrait permettre, en somme, d’éviter le calque en langue d’arrivée du moyen formel utilisé en langue de départ.

RÉFÉRENCES



BLANCO, X. (sous presse). « Repères sur l’enseignement des langues sur objectifs spécifiques à partir de la lexicographie informatique », Études de linguistique appliqueée, Paris : Didier-Érudition.

BLANCO, X. (dir.) 2001. Lexicologie contrastive espagnol-français. Langages, 143. Paris : Larousse.

BLANCO, X., BUVET, P.-A. (sous presse) : « Verbes support et significations grammaticales. Applications pour la traduction espagnol-français », Lingvisticæ Investigationes. Amsterdam / Philadelphia : John Benjamins Publishing Company.

BUVET, P.A, MATHIEU-COLAS, M. 1999. « Les champs Domaine et Sous-Domaine dans les dictionnaires électroniques », Cahiers de Lexicologie, 75 : 2. Paris : Didier-Érudition.

BUVET, P.-A., FOUCOU, P.-Y. 2000. « Extraction automatique des noms de profession sur le Web », Lingvisticæ Investigationes, XXIV : 1. Amsterdam / Philadelphia : John Benjamins Publishing Company.

GARRIGUES, M. 1992. « Dictionnaires hiérarchiques du français », Langue Française 96, Larousse, Paris.

GROSS, G. 1999. « Élaboration d’un dictionnaire électronique », Bulletin de la Société de Linguistique de Paris, XCIV :1. Paris : Peeters.

GROSS, G., GUENTHNER, F. 2002. « Comment décrire une langue de spécialité ? », Cahiers de Lexicologie, 80. Paris : Honoré Champion.

MATHIEU-COLAS, M. 2002. « La représentation des verbes dans un dictionnaire électronique. De la langue générale aux langues spécialisées », Cahiers de Lexicologie, 81. Paris : Honoré Champion.

MEJRI, S. 1997. Le figement lexical. Descriptions linguistiques et structuration sémantique, Publications de la Faculté des Lettres de la Manouba.

MEL’CUK, I. 1992. « Paraphrase et lexique : la théorie Sens-Texte et le Dictionnaire Explicatif et Combinatoire », dans Mel’cuk, I. (dir.) : Dictionnaire explicatif et combinatoire du français contemporain. Recherches lexico-sémantiques III. Montréal : Les Presses de l’Université de Montréal.

MEL’CUK, I. 1994. Cours de morphologie générale, vol. 2. Montréal : Les Presses de l’Université de Montréal.

LE PESANT, D. 2000. Six études de sémantique lexicale sur les noms locatifs. Manuscrit présenté pour l’Habilitation à Diriger des Recherches, LLI, Université Paris 13.

LE PESANT, D. 2003. « Quelques schèmes productifs de noms composés de forme N de N », Cahiers de Lexicologie 82. Paris : Honoré Champion.

1   ...   15   16   17   18   19   20   21   22   ...   74

similaire:

Concepts, actions et outils linguistiques iconRapport d’outils Raknet
«Raknet», ce document est donc une explication de certains des principes de «Raknet» ainsi que de ses concepts fondamentaux et comment...

Concepts, actions et outils linguistiques iconParcours Fonctionnements Linguistiques et

Concepts, actions et outils linguistiques iconLes écoles de linguistiques

Concepts, actions et outils linguistiques iconContenus linguistiques: (vocabulaire, grammaire…)

Concepts, actions et outils linguistiques iconObjectifs communicationnels, culturels et linguistiques’

Concepts, actions et outils linguistiques iconAdos le spécialiste des séjours scolaires linguistiques et aventures

Concepts, actions et outils linguistiques iconBts se r V ice s I n f or m a t I qu e s a u X o r g a n I s at I on s
Dans tous les cas, les candidats doivent se munir des outils et ressources techniques nécessaires au déroulement de l’épreuve. Ils...

Concepts, actions et outils linguistiques iconLes outils de développement de Telelogic mettent l’industrie automobile sur la voie du succès
«Les outils Tau de Telelogic ont déjà fait leurs preuves dans le secteur des télécommunications où le zéro défaut est une devenue...

Concepts, actions et outils linguistiques iconMichel Vinaver, Écritures dramatiques, Essais d'analyse de textes de théâtre, Actes Sud, 1993
«lecture au ralenti» consiste dans le pointage des actions d'une réplique à l'autre ou même à l'intérieur d'une réplique, c'est-à-dire...

Concepts, actions et outils linguistiques iconConcepts et Techniques








Tous droits réservés. Copyright © 2016
contacts
ar.21-bal.com