Concepts, actions et outils linguistiques








télécharger 4.44 Mb.
titreConcepts, actions et outils linguistiques
page9/74
date de publication21.01.2020
taille4.44 Mb.
typeDocumentos
ar.21-bal.com > droit > Documentos
1   ...   5   6   7   8   9   10   11   12   ...   74

3.2. Constitution de ressources linguistiques sur le bambara


Au Mali, de nombreux textes sont produits dans les 11 langues nationales. Nous avons choisi de commencer par travailler sur le bambara, langue véhiculaire dominante dans le sens où elle est souvent utilisée comme langue de substitution par deux maliens de langues maternelles différentes [Calvet 1981]. La constitution de ressources linguistiques électroniques est en cours, elle se déroule en plusieurs étapes :

- recueil de textes variés (articles de journaux, manuels de santé, de psychologie, de gestion, contes, dictionnaire, etc.),

- conversion de ces textes, de format électroniques variés, au format Unicode,

- représentation normalisée des textes à l’aide d’XML.

En janvier 2004, nous avons collecté à Bamako un corpus de 89 684 mots en bambara. Ces textes sont issus de plusieurs auteurs (journalistes, écrivains) et appartiennent à différents genres (contes, manuels techniques, manuels de santé, récits, etc.). Ce corpus n’est évidemment pas définitif et sera complété au gré des nouvelles trouvailles.

La première étape pour l’exploitation d’un tel corpus est sa normalisation. Les textes sont tous écrits en bambara correct, respectant les décrets en vigueur, mais ils ont été produits avec des polices « redessinées » pour afficher les caractères spéciaux, ce qui rend impossible leur exploitation électronique tels quels. Nous avons donc modifié le codage de ces caractères spéciaux afin de respecter le standard Unicode, et avons balisé les textes avec des balises XML15 conformément la norme XCES16.

Nous avons aussi recueilli les fichiers électroniques constituant un dictionnaire bilingue bambara-français d’environ 8000 entrées [Bailleul 1996]. Ce dictionnaire constitue une importante ressource car les catégories lexicales des mots (nom, verbe) sont indiquées, ce qui permet d’envisager le calcul automatique des flexions et dérivations des mots en sein du correcteur orthographique. La transcription des mots diffère, cependant, des règles officielles car le bambara est une langue tonale et agglutinative ; le dictionnaire étant a priori destiné à des étrangers, l’auteur a indiqué les tons sous forme de signes diacritiques et il a rendu visible l’agglutination de mots en la marquant par un point et en donnant la traduction de chacun des mots, puis la traduction du composé (exemple : fàri.gan [corps.chaud] = fièvre). Des programmes ont donc été élaborés pour extraire les entrées du dictionnaire et leur catégorie grammaticale, modifier leur transcription (en supprimant signes diacritiques et point) afin de respecter les décrets. Le lexique a finalement été balisé conformément à la norme XCES.

Le corpus de textes ainsi que le dictionnaire vont permettre d’ébaucher le lexique électronique du bambara. Tous les mots des textes seront intégrés à ce lexique, ainsi que les mots du dictionnaire auxquels il faudra ajouter leurs flexions. Quelques calculs statistiques pourront être mis en place, bien que la taille du corpus soit insuffisante pour qu’ils soient vraiment significatifs. Nous pourrons augmenter la taille du corpus en lui ajoutant des textes afin d’améliorer la fiabilité de ces calculs.
4. Conclusion

Les obstacles techniques à l’écriture des langues africaines disparaissent grâce à l’émergence du standard Unicode pour le codage des caractères spéciaux. Les outils informatiques ne sont pas toujours adaptés à ces langues, mais d’ici quelques années des progrès considérables devraient avoir lieu, permettant ainsi aux africains d’utiliser leurs propres langues dans les environnements de communication les plus modernes.

L’apparition de correcteurs orthographiques adaptés aux langues africaines devrait favoriser la production d’écrits et augmenter la présence des langues africaines sur internet. Le développement effectif d’un correcteur pour le bambara ainsi que la constitution de ressources linguistiques électroniques pour cette langue constituent un projet pilote destiné à valider l’approche que nous avons décrite. D’autres travaux suivant la même stratégie sont initiés dans d’autres langues de la région (wolof au Sénégal, hausa et zarma au Niger).


Bibliographie



[Andries 2002] Andries, P., Introduction à Unicode et à l’ISO 10646, Document numérique, vol.6, n°3-4, pp. 51-88, 2202.

[Bailleul 1996] Bailleul, C. Dictionnaire bambara-français, éd. Donniya, Bamako, Mali, 1996.

[Calvet 1981] Calvet, L.-J., Les langues véhiculaires, PUF, Que sais-je ?, 1981.

[Calvet 1984] Calvet, L.-J., La tradition orale, PUF, Que sais-je ?, 1984.

[Chanard 2001] Chanard, C., Popescu-Belis A., "Encodage informatique multilingue : application au contexte du Niger", Les cahiers du RIFAL, n°22, pp. 33-45, 2001.

[Galtier 1993] Galtier, G., Séminaire harmonisation du Mandingue, DNALA/ACCT, Bamako, 24-28 août 1993.

[Kukich 1992] Kukich, Karen. "Techniques for automatically correcting words in text", ACM Computing Surveys, 24(4), pp. 377–439. 1992.

[Mbodj 2002] Mbodj, C., "Orthographe commune et législations nationales", Writing African – The Harmonisation of Orthographic Conventions in African Languages, ed. Kwesi Kwaa Prah, pp. 55-64, 2002.

[Owino 2002] Owino, F. R., "The expansion of dholuo vowel system", Writing African – The Harmonisation of Orthographic Conventions in African Languages, ed. Kwesi Kwaa Prah, pp. 151-160, 2002.

[Van der Veken 2003] Van der Veken, A., de Schryver, G.-M., "Les langues africaines sur la Toile : études des cas haoussa, somali, lingala et isixhosa", Les cahiers du RIFAL, n°23, pp. 33-45, novembre 2003.


Annexe : Les affixes en bambara


1. Les préfixes

Tous se rattachent à une base verbale.


préfixe

sens

exemples

la–

causalité

la– + bù (sortir) = labù (faire sortir)

la– + kuma (parler) = lakuma (faire parler)

ma–

contact

mav + bù = mabù (écarter, éloigner)

ma– + jigin (descendre) = majigin (l’amener vers soi)

sù–

contact

sù– + bù = sùbù (écarter, éloigner

sù– + don (entrer) = sùdon (s’approcher)


2. Les suffixes de dérivation

2.1. Suffixes de dérivation se rattachant à une base nominale


suffixe

Sens

exemples

–la17


Lieu

Kulubali (nom de famille) + –la = kulubalila (chez les Coulibaly)

Cq (mari) + –la = domicile conjugal

Kùnù (ventre) + –na = kùnùna (intérieur)

–ka

habitant de

bamakù + –ka = bamakùka (qui vient de Bamako, Bamakois)

–ya18

État

mùgù (l’humain) + –ya = mùgùya (le fait d’être humain)

muso (femme) + –ya = musoya (le fait d’être femme, la féminité)

–tù

défaut, maladie

fiyen (la cécité) + –tù = fiyentù (qui est atteint de cécité, aveugle)

–ma

qui contient

kùgù (sel) + –ma = kùgùma (qui a du sel, salé)

–ntan

privation

kùgù (sel) + –ntan = kùgùntan (qui n’a pas de sel, non salé)

–lama19

aspect

mùgù + –lama = mùgùlama (qui a l’aspect d’une personne)

–ba

augmentatif

wari (argent) + –ba = wariba (une grande somme)

–nin 

dimunitif

wari + –nin = warinin (une petite somme)

–w20

pluriel

so (maison) + –w = sow (maisons)


2.2. Suffixes de dérivation se rattachant à une base verbale et formant avec les bases auxquelles ils se rattachent des dérivés nominaux ;


suffixe

sens

exemples

–la21


agent habituel d’une action

dununfù (battre le tam-tam) + –la = dunufùla (batteur de tam-tam)

misigqn (chasser les bœufs) + –na = misigqnna (berger, pasteur)

–baga

(ou –baa)

agent ponctuel d’une action

dqmq (aider) + –baga = dqmqbaga (qui aide)


–li 22

action

taa (partir) + –li = taali (le fait de partir, départ)

segin (retourner) + –ni = retour

–lan23

instrument

sqbqnnikq (écrire) + –lan = sqbqnnikqlan (instrument avec lequel on écrit)

misigqn + –nan = misigqnnan (instrument avec lequel on chasse les bœufs)

–nci 

superlatif ou excès (souvent péjoratif)

janfa (trahir) + –nci = janfanci (traître)

hinq (pitié) + –nci = hinqnci (trop miséricordieux)

–bali 

négation, privation

taa (partir) + –bali = taabali (le fait de ne pas partir)

–ta 

destination

dun (manger) + –ta =dunta (destiné à être manger, qui est à manger)


2.3. Suffixe se rattachant à une base adjectivale et formant avec le radical des dérivés adjectivaux.

suffixe

sens

exemples

–man

qualité

kqnq (en santé) + –man = kqnqman (bien portant)


2.4. Suffixes se rattachant à une base numérale et formant avec le radical des dérivés numéraux.

suffixe

sens

exemples

–nan

ordre, rang

fila (deux) + –nan = filanan (deuxième)

–la24

quantité

saba (trois) + –la = sabala (qui coûte quinze francs, 3 fois 5 francs)

Les suffixes de conjugaison

Suffixes rattachés à une base verbale pour indiquer très généralement un passé : –ra25, –len26 et tù.

verbe

Exemple

ka taa (partir)

Cqw ni musow taara. (les hommes et les femmes sont partis.)

ka wasa (être satisfait)

Bqq wasara. (tout le monde est satisfait.)

ka boli (courir)

U bolila kunun. (Ils ont couru hier.)

ka wuli (se lever)

Denmisqnw wulila. (Les enfants se sont levés.)

ka segin (revenir, retourner)

Taamadenw seginna. (Les voyageurs sont revenus.)

ka kuma (parler)

An kumana kosqbq. (Nous avons beaucoup parlé.)

ka taa (partir)

A taalen, jama wulila. (la foule s’est levée quant elle est partie

ka taa (partir)

Taamadenw seginnen, a taara. (Il est parti quand les voyageurs ont été de retour.)

ka bin (tomber)

A taatù binna. (Il est tombé en partant.)


1   ...   5   6   7   8   9   10   11   12   ...   74

similaire:

Concepts, actions et outils linguistiques iconRapport d’outils Raknet
«Raknet», ce document est donc une explication de certains des principes de «Raknet» ainsi que de ses concepts fondamentaux et comment...

Concepts, actions et outils linguistiques iconParcours Fonctionnements Linguistiques et

Concepts, actions et outils linguistiques iconLes écoles de linguistiques

Concepts, actions et outils linguistiques iconContenus linguistiques: (vocabulaire, grammaire…)

Concepts, actions et outils linguistiques iconObjectifs communicationnels, culturels et linguistiques’

Concepts, actions et outils linguistiques iconAdos le spécialiste des séjours scolaires linguistiques et aventures

Concepts, actions et outils linguistiques iconBts se r V ice s I n f or m a t I qu e s a u X o r g a n I s at I on s
Dans tous les cas, les candidats doivent se munir des outils et ressources techniques nécessaires au déroulement de l’épreuve. Ils...

Concepts, actions et outils linguistiques iconLes outils de développement de Telelogic mettent l’industrie automobile sur la voie du succès
«Les outils Tau de Telelogic ont déjà fait leurs preuves dans le secteur des télécommunications où le zéro défaut est une devenue...

Concepts, actions et outils linguistiques iconMichel Vinaver, Écritures dramatiques, Essais d'analyse de textes de théâtre, Actes Sud, 1993
«lecture au ralenti» consiste dans le pointage des actions d'une réplique à l'autre ou même à l'intérieur d'une réplique, c'est-à-dire...

Concepts, actions et outils linguistiques iconConcepts et Techniques








Tous droits réservés. Copyright © 2016
contacts
ar.21-bal.com