Page principale | Tableaux de l'A.P.I. | Cours de phonétique | Indo-européen | Langues non IE | Divers | Configuration | Écrire à l'auteur

Attention ! Ce document est encodé en utf-8 et nécessite qu'une police Unicode riche comme Arial Unicode MS, Titus Cyberbit Basic ou Code2000 soit disponible pour un affichage correct.

 

Notation latine des langues africaines au moyen d'Unicode


Plan : cliquez sur les lignes de séparation dans le corps de l'article pour revenir au plan.


Introduction

I. Voyelles
  1. Modifications de a
  2. Modifications de e
  3. Modifications de i
  4. Modifications de o
  5. Modifications de u
II. Consonnes
  1. Apostrophe
  2. Modifications de b
  3. Modifications de c
  4. Modifications de d
  5. Modifications de f
  6. Modifications de g
  7. Modifications de h
  8. Modifications de k
  9. Modifications de l

 

 
  1. Modifications de n
  2. Modifications de p
  3. Modifications de s
  4. Modifications de t
  5. Modifications de v
  6. Modifications de w
  7. Modifications  de y
  8. Modifications de z

 

  • Index des caractères

 

Un grand nombre de langues africaines, dont l'écriture a été récemment normalisée, utilisent des caractères latins pour leur notation. Certains caractères ne sont pas disponibles dans les jeux courants de la norme ISO 8859. Unicode / ISO-10646 permet, en revanche, leur affichage.

Il faut distinguer deux types de notations : l'orthographe traditionnelle de la langue et la notation scientifique (ou scolaire). Cette dernière est plus précise, puisque elle indique des détails phonétiques que l'orthographe ne note pas, tels les tons ou les quantités vocaliques.

Ce document se veut avant tout la récapitulation d'une discussion qui s'est tenue sur fr.comp.normes.unicode et se poursuit sur la liste de diffusion A12N-Collaboration, à l'initiative de Don Osborn. Il faut aussi signaler le site d'Indrek Hein, qui constitue une base de données fondamentale sur les jeux de caractères.

Depuis leur écriture, ces pages n'ont pas été corrigées : elles sont maintenant périmées et il est grandement préférable de consulter le site Bisharat, sur lequel les travaux ont été continués et amplifiés.
 


Nota bene : ne sont indiqués que les caractères ne faisant pas partie d'un des jeux d'ISO 8859 ou les caractères rares. Les tableaux sur fond gris notent des caractères ne devant normalement pas être utilisés pour les langues africaines mais réservés à d'autres usages ; les tableaux sur fond blanc, quant à eux, indiquent que des glyphes ne sont disponibles qu'en tant que combinaisons de deux caractères différents, ce qui me semble devoir être évité. Enfin, Unicode (ou d'autres sources) précise qu'un certain nombre de caractères servent à noter des langues africaines sans que j'en trouve d'exemple. De tels caractères sont écrits sur un fond bleu. Si une lettre est un composé non attesté, le tableau sera à bordure bleue sur fond blanc.

Lorsque un caractère est recensé par l'African Language Resource Council (A.L.R.C.), il est marqué du symbole .

 


 

I. Voyelles

Beaucoup de langues africaines sont tonales ; les éditions scientifiques ou scolaires sont en général les seules à noter les tons, au moyen de diacritiques tels que l'aigu, le grave, le circonflexe ou le háček. Le nombre de combinaisons possibles étant important, il n'est pas possible dans ce document de les répertorier toutes. Il existe généralement un pré-composé pour les voyelles latines marquées d'un accent, ou d'un tilde. Des combinaisons plus complexes (voyelle pointée frappée du grave, voyelle originale et circonflexe...) obligent souvent à la composition.

1. Formes modifiées de la lettre A

Le a bref est simplement noté par un pré-composé ; il semble avoir été utilisé pour le ouolof, bien que je n'en aie trouvé aucune attestation. Il pourrait dans ce cas servir à transcrire [ǝ], maintenant noté par ë 

 
  Haut de casse Bas de casse
Glyphe Ă ă
Emplacement U+0102 U+0103
Jeu de caractères latin étendu-A latin étendu-A
Exemple  ouolof (?)



B) Le a doté d'un trait vertical (ou d'une apostrophe droite) souscrit ne peut être obtenu que par la composition :

 
  Haut de casse Bas de casse
Glyphes
Emplacement U+0041 + U+0329 U+0061 + U+0329
Jeu de caractères latin-1 et marques diacritiques d'association latin-1 et marques diacritiques d'association
Exemple  twi

 Il ne m'a pas été possible de déterminer si l'on peut remplacer ce diacritique par un point souscrit, auquel cas il existe un pré-composé.

 


C) Le a circonflexe souscrit n'existe étrangement pas comme pré-composé : 

 
  Haut de casse Bas de casse
Glyphes
Emplacement U+0041 + U+032D U+0061 + U+032D
Jeu de caractères latin-1 et marques diacritiques d'association latin-1 et marques diacritiques d'association
Exemple  venda


 

2. Formes modifiées de la lettre e

A) On note la présence de la voyelle neutre (voyelle centrale d'aperture moyenne, A.P.I. [ə],  schwa), notée dans l'alphabet pan-nigérian par : 

 
  Haut de casse Bas de casse
Glyphe Ǝ ǝ
Emplacement U+018E U+01DD
Jeu de caractères latin étendu-B
Exemple banda, kanouri

On devra donc réserver ce caractère aux seules langues africaines utilisant le clavier pan-nigérian. Le caractère suivant, dont le glyphe en bas de casse est similaire au précédent, est donc réservé à d'autres usages, comme la transcription phonétique ou la transcription scientifique de langues sans écritures ou certaines langues comme l'azéri ou le tatar : 

 

  Haut de casse Bas de casse
Glyphe Ə ə
Emplacement U+018F U+0259
Jeu de caractères latin étendu-B extensions A.P.I.
Exemple A.P.I., azéri, tatar

On prendra donc garde, pour faciliter les recherches de chaînes de caractères dans un document mêlant transcription phonétique et notation d'une langue africaine, à ne pas confondre ces deux caractères dont les glyphes en bas de casse sont identiques. Enfin, il faut noter que l'utilisation du haut de casse pour la transcription phonétique, quel que soit le caractère, ne se justifie pas, puisque l'A.P.I., par exemple, distingue certains symboles par la casse ; il est donc impossible de trouver dans un texte en A.P.I. le caractère U+018F, qui n'est pas un symbole.


B) Le e ouvert (c'est-à-dire la voyelle antérieure mi-ouverte non arrondie, A.P.I. [ɛ], est noté par un glyphe souvent identique en bas de casse à l'epsilon grec : 

 
  Haut de casse Bas de casse
Glyphe Ɛ ɛ
Emplacement U+0190 U+025B
Jeu de caractères latin étendu-B extensions A.P.I.
Exemple  bambara, baoulé, krio, twi, basa, dinka, éwé, peul, gã, kpellé, mendé, lingala

Ce caractère peut recevoir divers diacritiques indiquant les tons, diacritiques qui ne sont utilisés généralement que dans les éditions scientifiques ou scolaires. De tels signes auxiliaires, comme les accents aigus ou graves, ne peuvent être obtenus que grâce aux marques diacritiques d'association ; les jeux de caractères grec de base ou grec étendu possèdent souvent de tels pré-composés mais leur utilisation ne serait pas concluante. 

On peut noter que le twi fait usage d'un e ouvert nasalisé, noté par un tilde suscrit, soit ɛ̃ (U+025B + U+0303), bien que dans la pratique ce tilde ne soit pas utilisé. Le dinka, pour sa part, utilise le tréma pour indiquer la présence d'une phonation soufflée : ɛ̈ (U+058B + U+0308) vaut [ɛ̤] (toutes les voyelles du dinka peuvent être soufflées sauf u).

La majorité des langues et des transcriptions scientifiques utilisent ce caractère, au contraire du grec, qui, lui, se sert de : 

 
  Haut de casse Bas de casse
Glyphe Ε ε
Emplacement U+0395 U+03B5
Jeu de caractères grec de base

Noter enfin que le symbole mathématique de la constante d'Euler est noté par : 

 

 
Glyphe
Emplacement U+2107
Jeu de caractères symboles letterlike



C) Le e pointé existe en tant que pré-composé : 

 
  Haut de casse Bas de casse
Glyphe
Emplacement U+1EB8 U+1EB9
Jeu de caractères latin étendu additionnel latin étendu additionnel
Exemple  yorouba, bini, twi (?)

En yoruba, il est possible d'utiliser une variante avec trait vertical souscrit. Pour le twi, voir plus bas. Les voyelles marquées du point souscrit sont prononcées avec un recul de la racine de la langue ; ainsi, note [e̙] (aussi transcrit [e -ATR]). 



D) Le e pointé par le haut existe aussi en tant que pré-composé ; ce caractère peut être utilisé aussi dans des langues non africaines, comme le lithuanien :  

 
  Haut de casse Bas de casse
Glyphes Ė ė 
Emplacement U+0116 U+0117
Jeu de caractères latin étendu-A latin étendu-A
Exemple  basa, bamiléké

Je n'ai pas pu déterminer de manière sûre la valeur phonétique de ce caractère ; il semblerait qu'il équivaille au e ouvert.



E) Il existe un e doté d'un trait vertical (ou d'une apostrophe droite) souscrit ; le yoruba l'utilise en concurrence avec le e pointé (voir plus haut), mais il ne m'a pas été possible de déterminer si le twi fait de même : 

 
  Haut de casse Bas de casse
Glyphes
Emplacement U+0045 + U+0329 U+0065 + U+0329
Jeu de caractères latin-1 et marques diacritiques d'association latin-1 et marques diacritiques d'association
Exemple  twi, yorouba



F) Le e macron est facilement disponible : 

 
  Haut de casse Bas de casse
Glyphes Ē ē 
Emplacement U+0112 U+0113
Jeu de caractères latin étendu-A latin étendu-A
Exemple  sotho

Je n'ai pas réussi à savoir s'il s'agit d'un phonème à part entière ou d'une marque tonale.



G) On trouve en yoruba et en twi un e tilde ; dans cette dernière langue, il s'agit bien d'un phonème distinct, en l'occurrence un [e] nasalisé, soit []. En yoruba, il semblerait qu'il ne s'agisse que d'un marqueur tonal. Un pré-composé existe : 

 
  Haut de casse Bas de casse
Glyphes
Emplacement U+1EBC U+1EBD
Jeu de caractères latin étendu additionnel latin étendu additionnel
Exemple  twi, (yorouba)

 


 

H) Le e ouvert inversé est indiqué. Je n'en trouve pas d'exemple ; Unicode ne propose pas de variante en haut de casse. 

 
  Haut de casse Bas de casse
Glyphes ɜ
Emplacement extensions A.P.I.
Jeu de caractères U+025C
Exemple  ?

 


 

I) Le e accent circonflexe souscrit existe en tant que pré-composé : 

 
  Haut de casse Bas de casse
Glyphes
Emplacement U+1E18 U+1E19
Jeu de caractères latin étendu additionnel latin étendu additionnel
Exemple  venda


 

3. Formes modifiées de la lettre i

A) Le i pointé est représenté par un pré-composé : 

 
  Haut de casse Bas de casse
Glyphes
Emplacement U+1ECA U+1ECB
Jeu de caractères latin étendu additionnel latin étendu additionnel
Exemple  igbo

Dans cette langue, les voyelles marquées du point souscrit sont prononcées avec un recul de la racine de la langue ; ainsi, note [ i ̙] (aussi transcrit [i -ATR]). 


B) Le i tilde est représenté par un pré-composé ; c'est un [i] nasalisé : 

 
  Haut de casse Bas de casse
Glyphes
Ĩ
ĩ 
Emplacement U+0128 U+0129
Jeu de caractères latin étendu-A latin étendu-A
Exemple  kikouyou, twi

 


C) Caractères orphelins : 

  Haut de casse Bas de casse
Glyphes
Ɨ
ɨ 
Emplacement U+0197 U+0268
Jeu de caractères latin étendu-B extensions A.P.I.
Exemple  ?
  Haut de casse Bas de casse
Glyphes
Ɩ
ɩ
Emplacement U+0196 U+0269
Jeu de caractères latin étendu-B extensions A.P.I.
Exemple  ?

Ce caractère est distinct de l'iota grec : 

 
  Haut de casse Bas de casse
Glyphes
Ι
ι
Emplacement U+0399 U+03B9
Jeu de caractères grec de base grec de base

et du i sans point turc, dont la capitale est un simple i latin, naturellement dénué de point, donc fréquemment utilisé en tant que lettre latine simple dans les langues africaines : 

 
  Haut de casse Bas de casse
Glyphes
I
ı
Emplacement U+0049 U+0131
Jeu de caractères latin-1 latin étendu-A

 


 

4. Formes modifiées de la lettre o

A) O ouvert est une voyelle fréquente. Les langues utilisant le e ouvert font généralement aussi usage de l'o ouvert ; il s'agit du caractère de l'A.P.I. : 

 
  Haut de casse Bas de casse
Glyphe Ɔ ɔ
Emplacement U+0186 U+0254
Jeu de caractères latin étendu-B extensions A.P.I.
Exemple  bambara, baoulé, krio, twi, basa, dinka, éwé, peul, gã, kpellé, mendé, lingala

Dans certaines langues comme le twi, ce phonème peut être nasalisé ; il faut dans ce cas composer un glyphe au moyen d'U+0254 et U+0303. En dinka, toutes les voyelles pouvant être soufflées, ce qui est indiqué par le tréma, il faut procéder à une composition pour noter [ɔ̤] : ɔ̈ (U+0254 + U+0308).


B) Le o pointé existe en tant que pré-composé : 

 
  Haut de casse Bas de casse
Glyphe  
Emplacement U+1ECC U+1ECD
Jeu de caractères latin étendu additionnel latin étendu additionnel
Exemple  igbo, yorouba, bini, twi (?)

Sur certains documents, il est indiqué que le point souscrit du yoruba peut être remplacé par un trait vertical souscrit. Pour le twi, voir plus bas. En yoruba et igbo, les voyelles marquées du point souscrit sont prononcées avec un recul de la racine de la langue ; ainsi, note [o̙] (aussi transcrit [o -ATR]). 



C) Le point peut être placé en haut de la lettre ; il faut dans ce cas utiliser un caractère composé ; le résultat peut être assez décevant, surtout en haut de casse, où le point risque d'être masqué par la lettre : 

 
  Haut de casse Bas de casse
Glyphes Ȯ ȯ 
Emplacement U+004F + U+0307 U+006F + U+0307
Jeu de caractères latin-1 et marques diacritiques d'association latin-1 et marques diacritiques d'association
Exemple  basa, bamiléké

Ce caractère semble être l'équivalent d'un o ouvert.


D) Combinaison de o et d'un trait vertical ou d'une apostrophe droite souscrite : elle semble être utilisée en twi et en yoruba, en concurrence avec le o pointé. Il ne m'a pas été possible de déterminer si, en twi, il est possible de remplacer cette combinaison par une lettre pointée : 

 
  Haut de casse Bas de casse
Glyphes
Emplacement U+004F + U+0329 U+006F + U+0329
Jeu de caractères latin-1 et marques diacritiques d'association latin-1 et marques diacritiques d'association
Exemple  twi, yorouba



E) Le o macron est facilement disponible : 

 
  Haut de casse Bas de casse
Glyphes Ō ō 
Emplacement U+014C U+014D
Jeu de caractères latin étendu-A latin étendu-A
Exemple  sotho

Je n'ai pas réussi à savoir s'il s'agit d'un phonème à part entière ou d'une marque tonale.


F) Le o barré est en usage pour le bamiléké ; c'est un caractère de l'A.P.I. : 

 
  Haut de casse Bas de casse
Glyphes
Ɵ
ɵ 
Emplacement U+019F U+0275
Jeu de caractères latin étendu-B extensions A.P.I.
Exemple  bamiléké

Ce caractère est distinct du caractère cyrillique possédant la même forme : 

 
  Haut de casse Bas de casse
Glyphes
Ө
ө
Emplacement U+04E8 U+04E9
Jeu de caractères cyrillique cyrillique
Exemple  kazakh, kirghiz, turkmène

 


 

G) On trouve un o háček dont la valeur m'échappe ; il semblerait que cette lettre représente un o ouvert : 

 
  Haut de casse Bas de casse
Glyphe Ǒ ǒ
Emplacement U+014E U+014F
Jeu de caractères latin étendu-A latin étendu-A
Exemple  sénoufo


H) Le o circonflexe souscrit n'existe étrangement pas comme pré-composé : 

 
  Haut de casse Bas de casse
Glyphes
Emplacement U+004F + U+032D U+006F + U+032D
Jeu de caractères latin-1 et marques diacritiques d'association latin-1 et marques diacritiques d'association
Exemple  venda


 

5. Formes modifiées de la lettre u

A) Le u pointé est représenté par un pré-composé : 

 
  Haut de casse Bas de casse
Glyphes
Emplacement U+1EE4 U+1EE5
Jeu de caractères latin étendu additionnel latin étendu additionnel
Exemple  igbo

  En igbo, les voyelles marquées du point souscrit sont prononcées avec un recul de la racine de la langue ; ainsi, note [u̙] (aussi transcrit [u -ATR]). 


B) Le u tilde est représenté par un pré-composé : 

 
  Haut de casse Bas de casse
Glyphes
Ũ
ũ 
Emplacement U+0168 U+0169
Jeu de caractères latin étendu-A latin étendu-A
Exemple  kikouyou, twi

 


C) On trouve dans certaines éditions un u barré, dont la valeur phonétique est celle du symbole de l'A.P.I. auquel il est emprunté ; chose curieuse, cette lettre ne semble pas avoir de caractère en haut de casse dans Unicode : 

 
  Haut de casse Bas de casse
Glyphes
ʉ 
Emplacement U+0289
Jeu de caractères Extensions A.P.I.
Exemple    bamiléké


 

D) Caractère orphelin : u oméga renversé

 
  Haut de casse Bas de casse
Glyphes
Ʊ
ʊ
Emplacement U+01B1 U+028A
Jeu de caractères latin étendu-B extensions A.P.I.
Exemple ?

 


 

E) Le u accent circonflexe souscrit existe en tant que pré-composé : 

 
  Haut de casse Bas de casse
Glyphes
Emplacement U+1E76 U+1E77
Jeu de caractères latin étendu additionnel latin étendu additionnel
Exemple  venda


Haut de page

 

 

Attention ! Ce document est encodé en utf-8 et nécessite qu'une police Unicode riche comme Arial Unicode MS, Titus Cyberbit Basic ou Code2000 soit disponible pour un affichage correct. 

Dernière modification : lundi 19 août 2002.

© Vincent Ramos, 2001  Les remarques, commentaires, corrections ou questions sont bienvenus –