Concepts de translittération

Les translittérations de script nécessitent un certain nombre de qualités. Une bonne translittération doit être :

  • Terminés
  • Prévisible
  • Prononçable
  • Sans équivoque

Ces qualités sont rarement satisfaites simultanément, de sorte que le stage Transliterator tente d'équilibrer ces exigences.

Terminés

Chaque séquence bien formée de caractères dans le script source doit translittérer en une séquence de caractères à partir du script cible.

Prévisible

Les lettres elles-mêmes (sans aucune connaissance des langues écrites dans ce script) doivent être suffisantes pour la translittération, basée sur un nombre relativement restreint de règles. Cela permet à la translittération d'être effectuée mécaniquement.

Prononçable

La translittération offre moins d'utilité si le processus fait correspondre simplement les caractères sans tenir compte de leur prononciation. Mapper simplement « αβγδεζηθ... » en « abcdefgh... » donne des chaînes qui peuvent être complètes et sans ambiguïté, mais impossible à prononcer.

Souvent, les méthodes de translittération standard ne suivent pas les règles de prononciation d'une langue particulière dans le texte cible. Par exemple, le système Hepburn japonais utilise un « j » qui a la valeur phonétique anglaise (par opposition aux français, allemand ou espagnol), mais utilise des voyelles qui n'ont pas les sons de l'anglais standard. Une méthode de translittération peut également exiger des connaissances particulières pour avoir la bonne prononciation. Par exemple, dans le système japonais kunrei-siki, « tu » se prononce « tsu ». Cela ressemble à des situations où il y a différentes langues dans le même script. Par exemple, savoir que le mot Gewalt vient de l'allemand permet à un lecteur compétent de prononcer le « w » comme un « v ».

Dans certains cas, la translittération peut être fortement influencée par la tradition. Par exemple, la lettre bêta (β) en grec moderne sonne comme un « v », mais une transformation peut continuer à utiliser un b (comme dans biologie). Dans ce cas, l'utilisateur doit savoir qu'un « b » dans le mot translittéré correspond à bêta (β) et doit être prononcé comme un « v » en grec moderne. Les lettres peuvent aussi être translittérées différemment selon leur contexte pour rendre la prononciation plus prévisible. Par exemple, depuis la séquence grecque GAMMA GAMMA (γγ) est prononcé comme « ng », le premier GAMMA peut être transcrit comme un « n »

Remarque : En général, afin de produire des résultats prévisibles lors de la translittération de scripts latins en scripts différents, le texte anglais ne produit pas de résultats phonétiques. En effet, la prononciation de l'anglais ne peut pas être prédite facilement à partir des lettres d'un mot. Par exemple, grove, move et love se terminent avec « ove », mais sont prononcés différemment.

Sans équivoque

Il doit toujours être possible de récupérer le texte du script source à partir de la translittération du script cible. Par exemple, le mot Elláda doit pouvoir revenir vers l'original Ελλάδα. Cependant, en translittération, des caractères multiples peuvent produire des ambiguïtés. Par exemple, le caractère grec PSI (ψ) mappe vers ps, mais ps peut aussi découler de la séquence PI, SIGMA (πσ) comme PI (π) mappe vers p et SIGMA (σ) mappe vers s.

Pour gérer le problème de l'ambiguïté, Transliterator utilise une apostrophe pour désambiguïser les séquences de caractères. Avec cette procédure, le caractère grec PI SIGMA (πσ) mappe vers p's. En japonais, chaque fois qu'une séquence ambigüe dans le script cible ne découle pas d'une seule lettre, la transformation utilise une apostrophe pour lever l'ambiguïté sur elle. Par exemple, il utilise cette procédure pour faire la distinction entre man'ichi et manichi.

Remarque : Certains caractères dans un script cible ne se trouvent pas normalement à l'extérieur de certains contextes. Par exemple, le petit caractère japonais « ya », comme dans « kya » (キャ), n'est pas isolé généralement. Pour gérer ces caractères, Transliterator utilise un tilde. Par exemple, l'entrée « ~ya » peut produire un petit « ya » isolé. Lors de la translittération du grec, l'entrée « a~s » peut produire un sigma grec non-final (ασ) à la fin d'un mot. De même, l'entrée « ~sa » peut produire un sigma final dans une position non-finale (ςα).

Pour les transformations de scripts généraux, une technique courante pour la réversibilité est d'utiliser des accents supplémentaires pour distinguer les lettres qui ne peuvent être distinguées autrement. L'exemple suivant représente le texte grec qui est mappé en latin entièrement réversible :