Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
2_composition:langues:multilinguisme:editer_textes_multilingues [2021/02/10 18:39] – Suppression de ce qui ne concerne pas l'édition. jejust3_composition:langues:multilinguisme:editer_textes_multilingues [2021/05/09 11:04] (Version actuelle) – [Généralités] bdumont
Ligne 1: Ligne 1:
-====== Comment composer des textes multilingues? ======+====== Comment saisir du texte dans plusieurs alphabets ? ======
  
-FIXME Page très riche, mais beaucoup trop longue ! Découper en pages plus précises et transformer celle-ci en page chapeau avec des liens vers les autres pages.+===== Généralités =====
  
 +La composition du texte se fait à l'aide d'un éditeur. Cet éditeur doit
 +permettre la saisie des caractères, glyphes des différents langages. 
 +Grâce au support de l'UTF-8, <latex>\LaTeX</latex> permet maintenant de saisir les caractères
 +exactement comme ils doivent être imprimés et non en [[https://fr.wikipedia.org/wiki/Beta_Code|beta code]]((Nous utilisons //beta code// au sens large, y compris pour la saisie d'autres langues que le grec.)).
 +Aujourd'hui, l'usage du beta code (p. ex. ''<a'' pour ἁ dans un environnement ''greek'') semble devoir se réduire à l'insertion ponctuelle
 +de quelques mots, sauf dans de rares cas où une extension offre des fonctionnalités reposant sur
 +un encodage en beta code que l'on ne pourrait pas avoir avec une saisie directe des caractères
 +(p. ex. avec [[ctanpkg>arabluatex|ArabLuaTeX]]).
 +         
 +Nous nous intéressons ici uniquement à la saisie directe des caractères unicodes, en envisageant plusieurs cas. 
 +Si vous souhaitez saisir du texte en beta code, vous pouvez [[3_composition/langues:composer_un_document_latex_en_grec_moderne_ou_classique#exemple_complet_de_saisie_en_beta_code_avec_pdflatex|voir un exemple pour le grec]] 
 +et vous référer à la documentation des extensions correspondantes. FIXME //Préciser où on peut trouver les infos//
  
-$\Reponse$  La composition de textes multilingues se décompose en +==== Saisie de deux langues différentes ====
-plusieurs parties avec chacune leurs problèmes. En premier lieu  +
-vient la saisie des documents. Ensuite vient une phase éventuelle +
-de transcodage, puis le traitement par <latex>\LaTeX</latex>. Il faudra ajouter +
-la gestion des fontes de caractères avec leur codage qui est  +
-différent pour l'éditeur et <latex>\LaTeX</latex> et en final l'impression, +
-ou la conversion en un type différent de document comme  +
-les documents ''PDF'' ou ''html''. Je parlerais surtout des +
-solutions Linux/Unix, car je n'ai ni Windows, ni Mac +
-...mais j'ajouterais ce que je trouverais  sur le net pour ces  +
-systèmes d'exploitation.+
  
 +Le premier cas est celui de la saisie de deux langues différentes.
  
-===== Comment éditer les textes multilingues? ===== +=== Éditeur de texte ===
- +
- +
-$\Reponse$  Généralités. +
- +
-La composition du texte se fait à l'aide d'un éditeur. Cet éditeur doit +
-permettre la saisie des caractères, glyphes des différents langages. Ce qui +
-me semble extrêmement important est que les caractères apparaissent +
-exactement comme ils doivent être imprimés et non comme une suite de +
-caractères sans signification (voir l'exemple de ''ArabTeX'' donné dans +
-cette même section.) +
-          +
-Nous pouvons distinguer 2 cas: +
-  +
-\begin{itemize} +
-%%%%%%%%%%%%%%%%%%%%%%% +
-\item Le premier cas est celui de la saisie de deux langues différentes. Une +
-des langues sera presque obligatoirement l'anglais (on pourra vérifier cas +
-par cas si le français peut être la langue principale), et l'autre pourra +
-être une langue comme une autre langue européenne, une langue à idéogramme +
-ou autre. +
-  +
-%%%%%%%%%%%%%%%+
   
 La saisie des langues européennes pourra se faire avec n'importe quel La saisie des langues européennes pourra se faire avec n'importe quel
 éditeur généraliste à condition de disposer des fontes de caractères éditeur généraliste à condition de disposer des fontes de caractères
-correspondantes. En généralil ne sera possible de composer qu'en deux +correspondantes. Étant donné que les [[6_distributions:editeurs:start|bons éditeurs]] utilisent aujourd'hui 
-langues dont l'anglais si l'on n'utilise pas un éditeur utf8 ou spécialisé +un encodage UTF-8 par défauton ne devrait pas rencontrer de problèmes 
-(Emacs-mule).+à partir du moment où l'on utilise une fonte unicode qui couvre la langue 
 +ciblée.
  
-Pour ces langues <<alphabétiques>>, il suffit de changer la disposition du +=== Clavier === 
-clavier. Une applet est disponible dans le <<panel>>, que ce soit pour + 
-Linux, mac ou +Pour une saisie ponctuelle, une solution peut être utiliser un clavier virtuel 
-Windows.+en ligne, comme ceux du site [[https://www.lexilogos.com|Lexilogos]]. Si l'on 
 +souhaite saisir de longs textes, il peut être plus pratique de changer sa 
 +disposition de clavier sur son ordinateur. 
 + 
 +Pour les langues « alphabétiques », il suffit de changer la disposition du 
 +clavier. Une applet est disponible dans le « panel », que ce soit pour 
 +Linux, mac ou Windows.
  
 Sous Linux, il faut installer les fontes de caractères Sous Linux, il faut installer les fontes de caractères
 correspondantes, et configurer l'applet de changement de disposition de correspondantes, et configurer l'applet de changement de disposition de
-clavier (kdegnome) ou installer un programme indépendant de commutation +clavier (KDEGnome) ou installer un programme indépendant de commutation 
-de claviers.+de claviers. Référez-vous à la documentation de votre environnement de bureau.
  
 Sous Windows, il faut aller dans le panneau de Sous Windows, il faut aller dans le panneau de
Ligne 62: Ligne 50:
 Sous Mac, la procédure doit être identique. Sous Mac, la procédure doit être identique.
      
-Il y a juste une correspondance touche clavier, caractère de la langue. +On peut alors soit apprendre par cœur la disposition des touches sur le clavier, 
-Nous avons sur les ordinateurs vendus en France un clavier « azerty » qui +soit acheter un clavier multilingue, soit acheter des autocollants transparents 
-dispose des caractères accentués. +que l'on peut coller sur les touches de notre clavier pour obtenir un clavier bilingue.
-  +
-Je dispose (personnellement) de claviers cyrilliques (russes) qui proposent +
-deux gravures de lettres: en noir, le clavier se présente comme un clavier +
-«qwerty» standard, et en lettres rouges, le clavier propose les lettres +
-cyrilliques. +
-  +
-Des claviers spécifiques à chaque langue se trouvent sur internet, mais +
-dans les deux dispositions de touches, il y a toujours l'anglais.+
  
-Pour l'utilisation du français et du russe, par exemple, il faudra se munir +==== Écrire de droite à gauche ====
-de deux claviers si l'on veut disposer de la disposition propre à chaque +
-langue.  Sous Linux, cela ne pose aucun problème. Pour +
-Windows, merci de compléter. +
- +
-%%%%%%%%%%%%%%%%%%%%%%%%+
   
 Pour les langues comme l'hébreu ou l'arabe qui s'écrivent de droite à Pour les langues comme l'hébreu ou l'arabe qui s'écrivent de droite à
-gauche, il existe des éditeurs spécialisés. +gauche, un éditeur généraliste moderne devrait faire l'affaire. 
- +Toutefois, il existe aussi des éditeurs spécialisés, créés généralement 
 +quand les éditeurs généralistes offraient un support limité. Peut-être 
 +certains offrent-ils encore des fonctionnalités intéressantes
 Voici quelques références d'éditeurs spécialisés pour l'hébreu, l'arabe et Voici quelques références d'éditeurs spécialisés pour l'hébreu, l'arabe et
 d'autres langues: d'autres langues:
-  
-\begin{itemize} 
-\item ''he2'' : pour l'hébreu et l'anglais : 
-  \url{http://sourceforge.net/projects/he2}; 
-\item ''heb'' : pour l'hébreu et l'anglais. 
-  \url{http://www.qumran.org/ftp/local/hebrew/wordfont/files.htm} Ce site 
-  recense de nombreux autres éditeurs commerciaux ou non, ainsi que des 
-  fontes et utilitaires; 
-\item Il faut bien sûr y ajouter les éditeurs généraux comme ''vim'' et 
-  ''Emacs'' qui peuvent fournir des extensions spécifiques à certains 
-  langues. 
-\item ''Summisoft'': pour l'arabe \url{http://www.summitsoft.co.uk/}--- 
-  Windows--- 
-\item ''axmedit'': pour l'arabe, le farsi, le coréen et l'hébreu 
-  \url{http://www.langbox.com/arabic/axmedit.html} 
-  ---Linux--- 
-%  \item ''?'' ajouter ici d'autres références ... 
-\end{itemize} 
  
-%%%%%%%%%%%%%%%%%%%%%%%%+  * ''he2'' : pour l'hébreu et l'anglais : [[http://sourceforge.net/projects/he2]] ; 
 +  * ''heb'' : pour l'hébreu et l'anglais.  
 +  * Pour l'hébreu, [[http://www.qumran.org/ftp/local/hebrew/wordfont/files.htm|ce site]] recense de nombreux autres éditeurs commerciaux ou non, ainsi que des fontes et utilitaires ; 
 +  * ''Summisoft'': pour l'arabe [[http://www.summitsoft.co.uk/]] (Windows) ; 
 +  * ''axmedit'': pour l'arabe, le farsi, le coréen et l'hébreu [[http://www.langbox.com/arabic/axmedit.html]] (Linux) ; 
 + 
 +==== Langues à idéogrammes ==== 
 + 
 +FIXME Il serait bon que quelqu'un de compétent vérifie et actualise si besoin.
   
 La saisie de textes en langue orientale (à idéogrammes) nécessite La saisie de textes en langue orientale (à idéogrammes) nécessite
Ligne 118: Ligne 86:
 un mélange des deux méthodes. Ce programme s'aide de dictionnaires de mots, un mélange des deux méthodes. Ce programme s'aide de dictionnaires de mots,
 de dictionnaires de phrases qu'il est possible d'enrichir. de dictionnaires de phrases qu'il est possible d'enrichir.
- +
 Je détaillerai un peu plus loin. Je détaillerai un peu plus loin.
- +
 La société Suse, récemment rachetée par Novell propose un "HOWTO" (en La société Suse, récemment rachetée par Novell propose un "HOWTO" (en
 anglais) dédié aux langues asiatiques dites CJK, avec une description anglais) dédié aux langues asiatiques dites CJK, avec une description
 précise de la configuration des différents systèmes précise de la configuration des différents systèmes
 Linux.  Il y a aussi une partie sur <latex>\LaTeX</latex> et tous les Linux.  Il y a aussi une partie sur <latex>\LaTeX</latex> et tous les
-logiciels associés: \url{http://www.suse.de/~mfabian/suse-cjk/}+logiciels associés: [[http://www.suse.de/~mfabian/suse-cjk/]]
-               + 
-                   + 
-En mode <<langue spéciale>>, la séquence de touches est transmise au+En mode « langue spéciale », la séquence de touches est transmise au
 programme de saisie spécifique qui la transforme en une chaîne de caractère programme de saisie spécifique qui la transforme en une chaîne de caractère
 dans la langue désirée. dans la langue désirée.
- +
 Il y a une touche qui permet de passer d'une langue à l'autre (ou une Il y a une touche qui permet de passer d'une langue à l'autre (ou une
 combinaison de touches). combinaison de touches).
-  + 
-L'entrée pour les langues <<CJK>> se fait soit en mode phonétique "latin"+L'entrée pour les langues « CJK » se fait soit en mode phonétique "latin"
 ou translittération, soit en mode phonétique spécifique natif : Hiragana ou translittération, soit en mode phonétique spécifique natif : Hiragana
 pour le japonais, Hangul pour le coréen, Zhuyin pour le chinois.  Après pour le japonais, Hangul pour le coréen, Zhuyin pour le chinois.  Après
 saisie de la partie phonétique, s'il y a plusieurs possibilités, un choix saisie de la partie phonétique, s'il y a plusieurs possibilités, un choix
 est offert à l'utilisateur. est offert à l'utilisateur.
- +
 Voici quelques programmes qui se présentent sous la forme d'un serveur, Voici quelques programmes qui se présentent sous la forme d'un serveur,
 d'un client, et de dictionnaires. Ceux-ci sont disponibles sur toutes les d'un client, et de dictionnaires. Ceux-ci sont disponibles sur toutes les
 machines Linux ou Unix. machines Linux ou Unix.
-  + 
-\begin{itemize} +  ''xim'': [[http://www.opencjk.org/~yumj/project-chinput-e.html]] 
-\item ''xim'': http://www.opencjk.org/~yumj/project-chinput-e.html; +  ''uim''
-\item ''uim''; +  ''kinput''
-\item ''kinput''; +  ''xcin''
-\item ''xcin''; +  ''canna''.
-\item ''canna''. +
-\end{itemize}  +
  
 Sur les machines Windows, il faut aller dans Sur les machines Windows, il faut aller dans
 Panneau-de-configuration--Options régionales et installer le chinois. Ne Panneau-de-configuration--Options régionales et installer le chinois. Ne
-pas oublier d'ajouter les <<locales>> correspondantes. Vous pouvez ajouter +pas oublier d'ajouter les « locales » correspondantes. Vous pouvez ajouter 
-le japonais par la même occasion. Ici, une page d'explications: +le japonais par la même occasion. [[http://ccat.sas.upenn.edu/~nsivin/chinp.html||Ici, une page d'explications.]]
-\url{http://ccat.sas.upenn.edu/~nsivin/chinp.html+
- +
-Sur les machines Mac, il faut installer le <<CLK>> +
-(Chinese Language Kit (CLK)).  Voici une page en anglais pour les détails: +
-\url{http://humanum.arts.cuhk.edu.hk/~cmc/power-mag/individual/chi-ho/+
- +
-%%%%%%%%%%%%%%%%%%%%%%%% +
-  +
-\item Le deuxième cas est celui de la saisie de plusieurs langues très +
-différentes: ici, il n'y aura pas le choix, il faudra saisir en codage utf8 +
-et utiliser un éditeur qui le permette \vref{editeur-utf8}. +
- +
-Il sera aussi possible d'éditer le texte avec des éditeurs comme +
-''Emacs'' et ses variantes qui utilisent un codage propriétaire. +
- +
-Il est ensuite possible de transcoder le codage Emacs en utf-8 pour le +
-traitement par <latex>\LaTeX</latex>+
-\end{itemize} +
- +
- +
-===== Qu'est-ce que le codage des textes? ===== +
- +
- +
-$\Reponse$  Le Codage des textes est la représentation des  +
-caractères sous forme de nombres ou suite de nombres. +
-Un des codages très connu est l'ASCII qui code les caractères sans accents +
-sur des nombres de 0 à 127 (7 bits). +
- +
-Ce codage ne permet pas de représenter les caractères accentués utilisés +
-dans la langue française. +
-On a donc étendu le codage à 256 (sur 8 bits), et assigné les caractères +
-régionaux aux nombres de 128 à 256. +
- +
-Chaque pays a donc assigné ses caractères locaux et il y a donc des codages  +
-sur 8 bits différents pour chaque pays. +
- +
-Les codages connus commencent par ISO-8859 plus un chiffre qui caractérise le +
-pays (ISO-8859-1 pour le latin sans le signe euro). +
- +
-Les codages ont été normalisés maintenant (norme ISO). +
- +
-Pour les langues asiatiques qui n'utilisent pas un alphabet fini, mais des +
-idéogrammes, ce codage sur 8 bits est très insuffisant. Seuls 256 caractères +
-(glyphes) peuvent être codés. Ils ont donc codé leurs glyphes sur 2 octets, ce +
-qui permet de disposer de 65000 glyphes différents. Plusieurs codages +
-différents ont été utilisés pour la même langue, et sont utilisés +
-concurremment (suivant les machines, les régions, les habitudes, les programmes +
-utilisés), ce qui pose souvent le problème de la récupération des documents +
-quand des programmes utilisent un codage propriétaire et ne sont plus maintenus. +
-(voir déjà  le problème du codage des langues asiatiques sur ''MacWord'' +
-(version 2 de ''Word'') qui ne permet pas de récupérer +
-les textes sur les nouveaux Macs avec la nouvelle version de ''Word''.) +
- +
- +
-Le codage sur 8 bits ne permet que l'emploi de 2 langues dont l'anglais, sauf +
-dans les cas de langues extrêmement proches comme l'allemand et le français. +
-Il est possible de coder les caractères et accents particuliers de ces deux  +
-langues  sur les 128 nombres supplémentaires. +
- +
-Pour pouvoir utiliser plusieurs langues très différentes simultanément, il faut +
-utiliser l'unicode, qui permet de représenter +
-toutes les langues. Le codage se fait sur plusieurs octets, et avec des codages  +
-différents (utf-8, utf-16 etc ...) +
- +
-Voir plus loin pour les détails. +
- +
-Les programmes de saisie de textes <<non utf-8>> doivent donc pouvoir distinguer +
-le passage d'une langue à l'autre. +
-Ils utilisent pour cela soit le 8ème bit du nombre pour savoir si le caractère +
-est régional ou pas, ou utilisent un système de balises comme le fait <latex>\LaTeX</latex>+
- +
-Encore faut-il que ce balisage, codage soit documenté pour la pérennité des  +
-documents saisis. +
- +
-Les éditeurs utf-8 utilisent le codage utf-8 pour représenter les glyphes, +
-caractères, et ne nécessitent donc pas de balisage de changement de langue. +
- +
- +
-===== Qu'est-ce que le codage des polices de caractères? ===== +
- +
- +
-$\Reponse$  Comme le codage des textes vu au-dessus, il a fallu représenter les +
-glyphes (dessins) des caractères sous forme de nombre (l'ordinateur ne travaille +
-qu'avec des nombres). +
- +
-Il y a donc une correspondance (bijection ...) entre le codage d'un caractère +
-de texte, et son codage dans la fonte. +
- +
-Il y a des quantités de codages, et <latex>\LaTeX</latex> utilise des codages particuliers +
-(il assigne les glyphes à sa façon). Il permet en plus d'utiliser des fontes +
-virtuelles qui sont composées de caractères piochés dans plusieurs polices. +
- +
-Nous verrons plus loin comment expliquer à <latex>\LaTeX</latex> quel codage est utilisé +
-pour le texte, et quel codage est utilisé pour la fonte. +
- +
- +
- +
- +
-===== Comment traiter les textes précédemment saisis avec LaTeX? ===== +
- +
-Suivant le codage utilisé pour la saisie, il sera peut-être nécessaire de +
-procéder à un transcodage du texte. Par exemple, ''Emacs'' utilise un  +
-codage propriétaire (mais documenté ! c'est un  logiciel GNU). +
-Il faudra configurer le codage de sauvegarde du texte pour qu'il soit  +
-utilisable par <latex>\LaTeX</latex>. Soit utf-8 pour traitement par \OMEGA ou +
-''UCS-LaTeX'', ou cjk pour traitement par ''CJK-LaTeX''+
- +
-Le paquetage [[ctanpkg>babel|babel]] permet de préciser le codage des textes avec  +
-l'option <<inputenc>>. Il faudra en plus expliciter le <<fontencoding>> pour +
-préciser le codage de la police utilisée. Ce paquetage permet de traiter de +
-nombreux langages. Se reporter à la documentation de [[ctanpkg>babel|babel]] pour les +
-langues disponibles. +
- +
-Voici quelques exemples d'utilisation de [[ctanpkg>babel|babel]]''CJK-LaTeX'' etc ... +
- +
-\begin{itemize} +
- \item{ Un exemple de [[ctanpkg>babel|babel]]: +
- Le texte a été saisi avec ''gvim'' en utilisant ma locale +
- par défaut (FR), et le codage est donc ISO-8859-1. +
-  +
-  +
-<code latex> +
- \documentclass{article} +
- +
- \usepackage[T1]{fontenc} +
- \usepackage[latin1]{inputenc} +
- \usepackage[frenchb]{babel} +
- +
- % Commentaire : fin du preambule +
- +
- \begin{document} +
- +
- \title{Titre de mon article} +
- \author{Le Monsieur \and La Madame} +
- \date{Le \today} +
- \maketitle +
- +
- \begin{abstract} +
- Résumé de mon article, passionnant. +
- \end{abstract} +
- +
- \tableofcontents +
- +
- \section{Explications} +
- +
- \texttt{fontenc}, \texttt{inputenc}  +
- sont des packages permettant d'utiliser +
- les accents. +
- \texttt{babel} sert à franciser le  +
- document. +
-  +
- \end{document} +
- </code> +
- +
-+
- \item Un exemple de ''CJK-LaTeX'': +
- Cet exemple a été saisi avec ''Emacs'' en utilisant la +
- version ---mule--- qui permet de saisir des textes en multiples +
- langues. Le codage interne est spécifique à ''Emacs'', mais +
- il est possible de spécifier avec quel codage on veut que +
- soit écrit le fichier sur le disque. +
- Le texte <<chinese.tex>> a été reproduit tel quel (je ne +
- comprends pas le chinois) et j'en ai seulement traduit la partie +
- en anglais. +
- Le texte a été traité par ''CJK-LaTeX'' et ''PDF-TeX''+
- +
- Il est difficile de montrer des exemples réels car cette FAQ +
- est en langage national, et ne gère pas l'utf-8. Dommage  +
- \ldots ! +
- Une solution serait d'inclure des images (exemples d'écran de +
- travail), mais la taille de cette FAQ augmenterait d'une façon +
- déraisonnable. +
-  +
- Notez la première ligne du texte qui indique à ''Emacs'' la +
- nature de le codage du texte. +
-  +
- +
-<code latex> +
- +
-%% -*- coding: emacs-mule -*- +
-\documentclass[12pt]{article} +
-\usepackage{times} +
-\renewcommand{\baselinestretch}{1.2} +
- +
-\begin{document} +
-\Large +
-\begin{tabular}{l@{\hspace{5em}}l} +
-  texte en chinois \\ +
-  texte en chinois \\[\medskipamount] +
-  chinois traditionnel & chinois simplifié \\ +
-  chinois traditionnel & chinois simplifié \\ +
-  chinois traditionnel & chinois simplifié \\ +
-  chinois traditionnel & chinois simplifié \\ +
-\end{tabular} +
- +
-\bigskip +
-\normalsize +
-\noindent +
-Un poème de  Li\v{u} Z\=ong  (773--819), affiché  +
-sur la partie gauche en chinois traditionnel, et +
-à droite en chinois simplifié. +
-''CJK-LaTeX'' s'interface parfaitement avec  +
-''Emacs-mule'' de telle façon qu'il +
-est possible de saisir et d'afficher différents  +
-types de fontes (Big5 pour les caractères +
-traditionnels, et GB2312 pour les caractères +
-simplifiésDans notre cas, c'est très utile, car +
-le caractère \emph{\v{a}i} ne fait pas partie de +
-la police GB2312. +
-J'ai donc substitué le caractère correspondant de +
-la fonte Big5. +
-Le fichier a été exporté en utilisant la fonction +
-\verb|cjk-write-file| fournie par le paquetage +
-''CJK-LaTeX'', et le résultat a été passé à +
-''PDF-LaTeX''+
- +
-Ici, signature en chinois \ldots +
- +
-\end{document} +
-</code> +
- +
- +
- \item{Un exemple de ''IvriTeX'': +
- Vous pourrez trouver des exemples dans la distribution de +
- ''IvriTeX'' à l'URL suivante: +
- \url{http://ivritex.sourceforge.net}. +
- }  +
- \item{Un exemple de ''THAI-LaTeX'': +
- Vous pourrez trouver des exemples dans la distribution +
- ''THAI-LaTeX'' à l'URL suivante: +
- \url{http://ichris.ws/latex} ou dans votre distribution +
- Linux adorée \ldots +
- Debian propose un paquetage <<thai-latex>>. Les exemples sont  +
- dans la section documentation. +
-+
- +
- \item{Un exemple de ''UCS-LaTeX'': +
- Le texte a été saisi avec ''gvim'' en mode utf-8. +
-  +
-  +
-<code latex> +
- \documentclass[french,8pts,a4paper]{article} +
- +
- \usepackage[notipa]{ucs} +
- \usepackage[utf8]{inputenc} +
- \usepackage[T1]{fontenc} +
- \usepackage[T3,T2A,T1]{autofe} +
- \usepackage[greek,french,russian,english]{babel} +
- +
- +
- \title{Un titre} +
- +
- \author{Auteur} +
- +
- % commande \frt pour écrire du texte français +
- \newcommand\frt[1]{\foreignlanguage{french}{#1}} +
- +
- % commande \rut pour écrire en russe +
- \newcommand\rut[1]{\foreignlanguage{russian}{#1}} +
- +
- % commande grt pour écrire du texte en grec +
- \newcommand\grt[1]{\foreignlanguage{greek}{#1}} +
- +
- % commande \phot pour écrire du texte en alphabet +
- %phonétique +
- \newcommand\phot[1]{\bgroup\fontencoding{T3}% +
- \selectfont\SetUnicodeOption{tipa}#1\egroup} +
- +
- +
- \begin{document} +
- +
- \maketitle +
- +
- \tableofcontents +
- +
- \section{Je suis auteur de textes multilingues et +
- de dictionnaires: comment faire ?} +
- +
- La composition de textes multilingues dans le cadre +
- d'un traitement +
- par \LaTeX doit se faire en ''UTF8''. En effet, +
- c'est le seul moyen pour \ldots +
- +
- \frt{Russe:+
- +
- Ici suit le texte en Unicode (russe) ... +
- +
- \rut{ texte en russe } +
- +
- +
- \frt{Grec (en Polytonic)}: +
- +
- Ici suit le texte en grec: +
- +
- \grt{ texte en grec } +
- +
- \end{document} +
- +
- </code> +
- +
-+
- +
- +
-\end{itemize} +
- +
- +
- +
-===== Pouvez-vous donner plus de détails sur les méthodes de saisie? ===== +
- +
- +
-$\Reponse$  les méthodes de saisie sont utilisées quand le nombre de glyphes +
-utilisés par la langue sont très supérieurs au nombre de touche d'un clavier. +
-Ces méthodes de saisie  sont donc utilisées pour toutes les langues à +
-idéogrammes. +
- +
-Le principe de saisie est le suivant: une fois l'éditeur mis dans le mode  +
-<<langue à idéogrammes>> l'appui d'une touche ne va pas donner un caractère, +
-mais faire apparaître une fenêtre (menu) qui va proposer différents choix en +
-fonction de ce qui a déjà été tapé. Il existe de nombreuses méthodes de saisie +
-qui sont fondées soit sur la phonétique, soit sur la structure, soit une +
-combinaison des deux, soit le codage direct des caractères. +
- +
-Une bonne méthode de saisie doit se contenter d'un nombre réduit de touches, +
-comme 26 touches par exemple. (disponibles sur des claviers occidentaux) +
- +
-Voyons les méthodes de saisie suivant les langues: +
- +
- +
-==== Quelles sont les méthodes de saisie du chinois? ==== +
- +
- +
-$\Reponse$  Je vais donner les informations trouvées sur le site: +
-\url{http://seba.ulyssis.org/thesis/im.php}, simplement +
-traduites car je ne suis en aucun cas un spécialiste des langues orientales. +
- +
-\begin{itemize} +
- \item{Méthodes fondées sur la phonétique: +
- \begin{itemize} +
- \item{pinyin: c'est la méthode officielle des Nations +
-   Unies. elle utilise les caractères trouvés sur les +
-   claviers occidentaux en association avec le <<ton>>+
-   Le <<ton>> est l'accentuation du mot. Cette méthode +
-   est assez verbeuse: zhong + guo or zhong1 + guo2 pour +
-   2 glyphes originaux. +
-           Plutôt que de choisir les tons dans un menu, il est +
-   possible de préciser le ton avec un chiffre à la fin +
-   du son comme écrit ci-dessus. Sur la page citée juste +
-   au-dessus, vous pourrez trouver plus de détails sur +
-   le positionnement des <<tons>>.} +
- \item{shuangpin: la méthode est dérivée de pinyin, mais +
-   avec une réduction sensible du nombre de touches à  +
-   taper. En général, une ou deux touches suffisent.} +
- \item{jianpin: cette méthode est intermédiaire entre  +
-   les deux précédentes. Voici un tableau de comparaison +
-   entre les 3 méthodes pour les mêmes glyphes: +
-  +
-   \begin{tabular}{|c|c|c|c|} +
-       \hline +
-   Hanzi & Pinyin & ShuangPin & JianPin \\ +
-   \hline +
-   glyphe & a   & a & a \\ +
-   glyphe & ku   & ku & ku \\ +
-   glyphe & chu   & uu & iu \\ +
-   glyphe & cuan   & cc & cuj \\ +
-   glyphe & zhang  & ag & ah \\ +
-   glyphe & shuang & ih & uuh \\ +
-   \hline +
-   \end{tabular} +
- +
-+
- \item{bopomofo: c'est une méthode développée en 1913 +
- et modifiée de nombreuses fois ensuite. Elle est +
- toujours d'actualité à Taïwan où elle est la méthode +
- officielle d'apprentissage. La saisie est fondée +
- sur des formes calligraphiques dont certaines sont  +
- dérivées de caractères d'origine chinoise. +
-  +
- La méthode repose sur 37 symboles, 21 consonnes, 16  +
- voyelles et 5 tons. +
- Le grand désavantage de cette méthode est qu'elle  +
- nécessite un clavier spécifique, car les touches +
- ne sont pas disponibles sur un clavier occidental. +
-+
- \end{itemize} +
- }  +
- \item{Méthodes fondées sur la structure:: +
- \begin{itemize} +
- \item{wubizixing: dans cette méthode, chaque glyphe  +
- peut être saisi par au plus 4 appuis de touches (2 au +
- minimum). +
- À chaque glyphe est associé une combinaison unique  +
- d'appui de touches. +
-  +
- Cette méthode divise le radical en 5 groupes, eux-même +
- divisés en 5 groupes. Ils sont assignés aux touches +
- de A à Y. La touche Z sert d'échappement. +
- +
-  +
- Voici un tableau de présentation: +
- +
-  +
- \begin{tabular}{|c|c|c|c|c|c|} +
- \hline  +
-     & Key 1  & Key 2 & Key 3 & Key 4 & Key 5 \\ +
- G1 & 1 1/G  & 1 2/F & 1 3/D & 1 4/S & 1 5/A \\ +
- G2 & 2 1/H  & 2 2/J & 2 3/K & 2 4/L & 2 5/M \\ +
- G3 & 3 1/T  & 3 2/R & 3 3/E & 3 4/W & 3 5/Q \\ +
- G4 & 4 1/Y  & 4 2/U & 4 3/I & 4 4/O & 4 5/P \\ +
- G5 & 5 1/N  & 5 2/B & 5 3/V & 5 4/C & 5 5/X \\ +
- \hline +
- \end{tabular}  +
-+
-  +
- \item{wubihua: cette méthode utilise le pavé numérique +
- (chiffre de 1 à 5 ; 6 est le caractère d'échappement. +
- À chaque chiffre est associé une partie de base du  +
- glyphe; En fait, le dessin du glyphe est décomposé +
- comme pour une écriture manuelle, et à chaque chiffre +
- est associé un mouvement. La lettre T française peut +
- être décomposée en une barre verticale et une  +
- horizontale. C'est le même principe. Il suffit d'entrer +
- les 5 chiffres consécutifs de la constitution du glyphe +
- suivi du caractère d'échappement (6).  +
-  +
- Voir le tableau de correspondance sur le site précité. +
-+
- \item{cangjie: cette méthode divise 24 radicaux en 4 +
- groupes assignés aux touches suivant cette liste: +
- +
-  +
- La traduction est certainement approximative \ldots +
- \begin{itemize} +
-   \item{groupe philosophique (A, B, C, D, E, F, G)} +
-   \item{groupe du trait de crayon (H, I, J, K, L, M, N)} +
-   \item{groupe des parties du corps (O, P, Q, R)} +
-   \item{groupe du contour du caractère(S, T, U, V, W, Y)} +
- \end{itemize} +
-+
- \item{sucheng: méthode dérivée de cangjie, mais avec +
-   une économie de touches à taper. } +
- \item{boshiamy: méthode développée à Taïwan. Elle +
-   utilise les 26 touches du clavier. Elle tient compte +
-   de la forme du glyphe, de sa prononciation, et de sa +
-   signification. Chaque glyphe nécessite l'appui de 2 à +
-   4 touches du clavier.} +
- \item{dayi: cette méthode utilise toutes les touches  +
-   disponibles du clavier, ce qui est un inconvénient. +
-   Seuls 2 appuis de touches sont nécessaires pour la +
-   saisie d'un glyphe.} +
- \item{sanjiao: cette méthode <<des trois coins>> est +
-   dérivée de la méthode des 4 coins, utilisée +
-   pour la recherche de glyphes dans un dictionnaire.} +
- \end{itemize} +
- }  +
- \item{Méthodes fondées sur une combinaison phonétique--structure: +
- Pas de détails trouvés. +
- \begin{itemize} +
- \item{tze-loi:+
- \item{renzhi:+
- \end{itemize} +
- }  +
- +
- \item{Méthodes de saisie directe: +
- Pas de détails trouvés. +
- \begin{itemize} +
- \item{dianbaoma:+
- \item{guojiquweima:+
- \item{neima:+
- \end{itemize} +
- }  +
- +
-\end{itemize} +
- +
- +
- +
-==== Quelles sont les méthodes de saisie du japonais? ==== +
- +
- +
- +
-$\Reponse$  La méthode de saisie du japonais est phonétique. On saisit phonétiquement en +
-caractères romains , et le programme qui supporte la méthode de saisie propose +
-le glyphe correspondant qui existe en trois versions: hiraganas, katakanas ou +
-kanjis. +
- +
-Les informations suivantes ont été trouvées sur la page suivante: +
-http://www.escale-japon.com/accueil.php?page=faq&select=faq +
- +
-Le japonais utilise 3 systèmes d'écriture: +
- +
-  * **Hiraganas**: système syllabaire qui permet d'écrire les mots d'origine japonaise, et servent aussi de fonctions grammaticales (conjugaison). +
-  * **Katakanas**: système syllabaire qui permet d'écrire les mots d'origine étrangère. +
-  * **Kanjis**: système identique au chinois(idéogrammes) qui associe à chaque glyphe un mot, un sens sans aucune équivoque possible. +
- +
-Voir cette page qui donne quelques informations supplémentaires:  +
-http://www.physics.wustl.edu/~alford/japanese_latex.html +
- +
- +
-==== Quelles sont les méthodes de saisie du russe? ==== +
- +
- +
-$\Reponse$  Méthode de saisie du russe: (valable pour toutes les langues européennes, et +
-celles dérivées.) +
- +
-C'est une méthode simple, car il y a correspondance directe entre les touches +
-dessinées sur le clavier et le caractère correspondant. +
- +
-Pour le russe, j'ai aussi vu une méthode de translittération qui traduisait +
-les suites de caractères romains en caractères cyrilliques (méthode phonétique).  +
-Un tel mode est disponible dans ''yudit''+
- +
- +
- +
-==== Quelle est la méthode de saisie du grec? ==== +
- +
- +
-$\Reponse$  La méthode est dérivée de la méthode de saisie simple, qui associe un caractère +
-à une touche. Le clavier peut ici se trouver en deux états: clavier romain +
-(latin) et clavier grec. Une touche (combinaison de touches) permet de commuter +
-d'un mode à l'autre. On utilise les touches mortes (de composition) pour certains +
-caractères. +
- +
- +
-==== Quelles sont les méthodes de saisie du coréen? ==== +
- +
-$\Reponse$  Il y a environ 8500 glyphes à saisir. On utilise 3 méthodes concurremment: +
- +
-  * **ASCII**: pour les caractères anglais. +
-  * **Hangul**: les glyphes sont constitués d'une consonne suivie d'une voyelle avec une finale consonnique optionnelle. Il y a une vérification de la conformité du glyphe (son en cas d'erreur). +
-  * **Hanja**: les glyphes Hanja ne peuvent être obtenus qu'à partir des glyphes Hangul. Il y a deux modes de conversion: simple et multiple. En cas de choix multiples, une liste est proposée. +
- +
- +
-==== Quelles sont les méthodes de saisie du vietnamien? ==== +
- +
- +
-$\Reponse$  La méthode est dérivée de la méthode simple une touche pour un caractère, +
-mais modifiée pour supporter les particularités de la langue. elle vérifie +
-la conformité des caractères saisis. Il y a des <<tons>> qui sont appliqués à  +
-certaines voyelles. +
-( a, e, i, o, u, y, a-circumflex, e-circumflex, o-circumflex, a-breve, o-horn, +
-or u-horn) +
- +
- +
- +
- +
- +
-===== Pouvez-vous donner plus de détails sur Unicode? ===== +
- +
- +
-$\Reponse$  Je vous renvoie aux sites suivants pour avoir plus de détails: +
-  * http://www.tuteurs.ens.fr/theorie/encodages.html +
-  * http://www.unicode.org/ +
- +
-Il y a aussi des listes de diffusion consacrées à Unicode. Voir votre  +
-lecteur de <<news>> préféré, et chercher <<Unicode>>+
- +
- +
- +
-==== Comment configurer la saisie des idéogrammes orientaux sur Windows? ==== +
- +
- +
-$\Reponse$  Voir les détails d'installation et de configuration à  +
-l'URL suivante: http://ccat.sas.upenn.edu/~nsivin/chinp.html +
-(en anglais). +
- +
- +
- +
-==== Comment configurer la saisie des idéogrammes orientaux sur Mac? ==== +
- +
- +
-$\Reponse$  Voir les détails d'installation et de configuration à +
-l'URL suivante: \url{http://www.yale.edu/chinesemac/pages/input_methods.html}. +
- +
- +
-==== Comment configurer la saisie des idéogrammes orientaux sur Linux/Unix} ==== +
- +
-$\Reponse$  Voici une liste d'URL qui vous donneront tous les détails +
-de configuration et d'installation des méthodes de saisie. Elles sont +
-disponibles sous forme de paquetages sur toutes les distributions. +
- +
-  * http://seba.studentenweb.org/thesis/linux.php +
-  * http://www.suse.de/~mfabian/suse-cjk/input.html +
-  * Voir le «debian chinese HOWTO» sur le site http://www.debian.org/ +
- +
- +
-===== Quels sont les problèmes de codage des textes? ===== +
- +
-$\Reponse$  Maintenant que votre texte est saisi, vous voulez le traiter +
-avec <latex>\LaTeX</latex>. Auparavant, il va falloir s'assurer que le codage de votre +
-texte sera accepté par <latex>\LaTeX</latex> (problème déjà entrevu auparavant). +
-Vous avez plusieurs possibilités suivant l'éditeur utilisé. +
- +
-\begin{itemize} +
- \item{Vous avez utilisé un éditeur utf-8: là, vous avez le +
-   choix d'utiliser soit ''UCS-LaTeX'', soit \OMEGA. Il +
-   faut savoir que toutes les langues ne sont pas supportées +
-   par ce programme. Une facilité est apportée par le paquetage +
-   optionnel \emph{autofe} de ''UCS-LaTeX'' qui permet de passer +
-   d'une langue à l'autre sans baliser le changement.} +
- \item{Vous avez utilisé un éditeur utf-8 mais les langues +
-   que vous utilisez ne sont pas traitées par ''UCS-LaTeX'' +
-   ou \OMEGA. Il vous faut utiliser un convertisseur de codage +
-   comme ''iconv''. Voir dans le chapitre utilitaires pour  +
-   d'autres programmes. Parfois, votre éditeur préféré vous +
-   permet de choisir le codage de sauvegarde du fichier, qui peut +
-   être différent de celui de la saisie. Voir ''Emacs'' par  +
-   exemple. Vous transcoderez votre texte par exemple en codage +
-   CJK et traiterez le texte avec ''CJK-LaTeX''. Le principe est +
-   le même pour ''Ivritex'' ou ''THAI-LaTeX'' ou ''Arab-TeX''.} +
- \item{Vous avez saisi  votre texte avec un éditeur spécialisé, +
- non utf-8, mais dont le codage est connu. Alors, soit l'éditeur +
- permet de spécifier le codage de sauvegarde, soit il faut  +
- utiliser un convertisseur. } +
- \item{Vous utilisez un éditeur <<propriétaire>> dont le format +
- d'enregistrement n'est pas connu, qui ne dispose pas de  +
- facilité d'exportation vers un format utilisable, changez de +
- programme... C'est inutilisable! (Qui a dit ''Word'') ??} +
- %j'assume le dernier item .......... +
-\end{itemize} +
- +
- +
-===== Pouvez-vous donner des exemples d'utilisation de ''UCS-LaTeX''? ===== +
- +
- +
-===== Pouvez-vous donner des exemples d'utilisation d'OMEGA? ===== +
- +
- +
-===== Pouvez-vous donner des exemples d'utilisation de ''THAI-LaTeX''? =====+
  
 +Sur les machines Mac, il faut installer le « CLK »
 +(Chinese Language Kit (CLK)).  [[http://humanum.arts.cuhk.edu.hk/~cmc/power-mag/individual/chi-ho/|Voici une page en anglais pour les détails.]]
  
-===== Pouvez-vous donner des exemples d'utilisation de ''IvriTeX''? ===== 
  
  
-===== Pouvez-vous donner des exemples d'utilisation de ''CJK-LaTeX''? ===== 
  
  
  
-{{htmlmetatags>metatag-keywords=(LaTeX) +{{htmlmetatags>metatag-keywords=(LaTeX,éditeurs de texte,interface,textes en plusieurs langues
-metatag-og:title=(Comment composer des textes multilingues?)+metatag-og:title=(Comment éditer des textes multilingues?)
 metatag-og:site_name=(FAQ LaTeX francophone) metatag-og:site_name=(FAQ LaTeX francophone)
 }} }}
  
3_composition/langues/multilinguisme/editer_textes_multilingues.1612982378.txt.gz · Dernière modification : 2021/02/10 10:59 (modification externe)
CC Attribution-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0