Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
2_composition:langues:multilinguisme:editer_textes_multilingues [2021/02/10 18:39] – Suppression de ce qui ne concerne pas l'édition. jejust | 3_composition:langues:multilinguisme:editer_textes_multilingues [2021/05/09 11:04] (Version actuelle) – [Généralités] bdumont | ||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | ====== Comment | + | ====== Comment |
- | FIXME Page très riche, mais beaucoup trop longue ! Découper en pages plus précises et transformer celle-ci en page chapeau avec des liens vers les autres pages. | + | ===== Généralités ===== |
+ | La composition du texte se fait à l'aide d'un éditeur. Cet éditeur doit | ||
+ | permettre la saisie des caractères, | ||
+ | Grâce au support de l' | ||
+ | exactement comme ils doivent être imprimés et non en [[https:// | ||
+ | Aujourd' | ||
+ | de quelques mots, sauf dans de rares cas où une extension offre des fonctionnalités reposant sur | ||
+ | un encodage en beta code que l'on ne pourrait pas avoir avec une saisie directe des caractères | ||
+ | (p. ex. avec [[ctanpkg> | ||
+ | |||
+ | Nous nous intéressons ici uniquement à la saisie directe des caractères unicodes, en envisageant plusieurs cas. | ||
+ | Si vous souhaitez saisir du texte en beta code, vous pouvez [[3_composition/ | ||
+ | et vous référer à la documentation des extensions correspondantes. FIXME //Préciser où on peut trouver les infos// | ||
- | $\Reponse$ | + | ==== Saisie |
- | plusieurs parties avec chacune leurs problèmes. En premier lieu | + | |
- | vient la saisie des documents. Ensuite vient une phase éventuelle | + | |
- | de transcodage, | + | |
- | la gestion des fontes de caractères avec leur codage qui est | + | |
- | différent pour l' | + | |
- | ou la conversion en un type différent de document comme | + | |
- | les documents '' | + | |
- | solutions Linux/Unix, car je n'ai ni Windows, ni Mac | + | |
- | ...mais j' | + | |
- | systèmes d' | + | |
+ | Le premier cas est celui de la saisie de deux langues différentes. | ||
- | ===== Comment éditer les textes multilingues? | + | === Éditeur de texte === |
- | + | ||
- | + | ||
- | $\Reponse$ | + | |
- | + | ||
- | La composition du texte se fait à l'aide d'un éditeur. Cet éditeur doit | + | |
- | permettre la saisie des caractères, | + | |
- | me semble extrêmement important est que les caractères apparaissent | + | |
- | exactement comme ils doivent être imprimés et non comme une suite de | + | |
- | caractères sans signification (voir l' | + | |
- | cette même section.) | + | |
- | + | ||
- | Nous pouvons distinguer 2 cas: | + | |
- | + | ||
- | \begin{itemize} | + | |
- | %%%%%%%%%%%%%%%%%%%%%%% | + | |
- | \item Le premier cas est celui de la saisie de deux langues différentes. Une | + | |
- | des langues sera presque obligatoirement l' | + | |
- | par cas si le français peut être la langue principale), | + | |
- | être une langue comme une autre langue européenne, | + | |
- | ou autre. | + | |
- | + | ||
- | %%%%%%%%%%%%%%% | + | |
La saisie des langues européennes pourra se faire avec n' | La saisie des langues européennes pourra se faire avec n' | ||
éditeur généraliste à condition de disposer des fontes de caractères | éditeur généraliste à condition de disposer des fontes de caractères | ||
- | correspondantes. | + | correspondantes. |
- | langues dont l' | + | un encodage UTF-8 par défaut, on ne devrait pas rencontrer |
- | (Emacs-mule). | + | à partir du moment où l'on utilise |
+ | ciblée. | ||
- | Pour ces langues | + | === Clavier === |
- | clavier. Une applet est disponible dans le <<panel>>, que ce soit pour | + | |
- | Linux, mac ou | + | Pour une saisie ponctuelle, une solution peut être utiliser un clavier virtuel |
- | Windows. | + | en ligne, comme ceux du site [[https:// |
+ | souhaite saisir de longs textes, il peut être plus pratique de changer sa | ||
+ | disposition de clavier sur son ordinateur. | ||
+ | |||
+ | Pour les langues | ||
+ | clavier. Une applet est disponible dans le « panel », que ce soit pour | ||
+ | Linux, mac ou Windows. | ||
Sous Linux, il faut installer les fontes de caractères | Sous Linux, il faut installer les fontes de caractères | ||
correspondantes, | correspondantes, | ||
- | clavier (kde, gnome) ou installer un programme indépendant de commutation | + | clavier (KDE, Gnome) ou installer un programme indépendant de commutation |
- | de claviers. | + | de claviers. Référez-vous à la documentation de votre environnement de bureau. |
Sous Windows, il faut aller dans le panneau de | Sous Windows, il faut aller dans le panneau de | ||
Ligne 62: | Ligne 50: | ||
Sous Mac, la procédure doit être identique. | Sous Mac, la procédure doit être identique. | ||
- | Il y a juste une correspondance touche | + | On peut alors soit apprendre par cœur la disposition des touches sur le clavier, |
- | Nous avons sur les ordinateurs vendus en France | + | soit acheter |
- | dispose | + | que l'on peut coller sur les touches |
- | + | ||
- | Je dispose (personnellement) | + | |
- | deux gravures de lettres: en noir, le clavier | + | |
- | «qwerty» standard, et en lettres rouges, le clavier propose les lettres | + | |
- | cyrilliques. | + | |
- | + | ||
- | Des claviers spécifiques à chaque langue se trouvent sur internet, mais | + | |
- | dans les deux dispositions de touches, il y a toujours l' | + | |
- | Pour l' | + | ==== Écrire |
- | de deux claviers si l'on veut disposer de la disposition propre | + | |
- | langue. | + | |
- | Windows, merci de compléter. | + | |
- | + | ||
- | %%%%%%%%%%%%%%%%%%%%%%%% | + | |
Pour les langues comme l' | Pour les langues comme l' | ||
- | gauche, il existe des éditeurs spécialisés. | + | gauche, un éditeur généraliste moderne devrait faire l' |
- | + | Toutefois, il existe | |
+ | quand les éditeurs généralistes offraient un support limité. Peut-être | ||
+ | certains offrent-ils encore des fonctionnalités intéressantes. | ||
Voici quelques références d' | Voici quelques références d' | ||
d' | d' | ||
- | |||
- | \begin{itemize} | ||
- | \item '' | ||
- | \url{http:// | ||
- | \item '' | ||
- | \url{http:// | ||
- | recense de nombreux autres éditeurs commerciaux ou non, ainsi que des | ||
- | fontes et utilitaires; | ||
- | \item Il faut bien sûr y ajouter les éditeurs généraux comme '' | ||
- | '' | ||
- | langues. | ||
- | \item '' | ||
- | Windows--- | ||
- | \item '' | ||
- | \url{http:// | ||
- | ---Linux--- | ||
- | % \item ''?'' | ||
- | \end{itemize} | ||
- | %%%%%%%%%%%%%%%%%%%%%%%% | + | * '' |
+ | * '' | ||
+ | * Pour l' | ||
+ | * '' | ||
+ | * '' | ||
+ | |||
+ | ==== Langues à idéogrammes ==== | ||
+ | |||
+ | FIXME Il serait bon que quelqu' | ||
La saisie de textes en langue orientale (à idéogrammes) nécessite | La saisie de textes en langue orientale (à idéogrammes) nécessite | ||
Ligne 118: | Ligne 86: | ||
un mélange des deux méthodes. Ce programme s'aide de dictionnaires de mots, | un mélange des deux méthodes. Ce programme s'aide de dictionnaires de mots, | ||
de dictionnaires de phrases qu'il est possible d' | de dictionnaires de phrases qu'il est possible d' | ||
- | + | ||
Je détaillerai un peu plus loin. | Je détaillerai un peu plus loin. | ||
- | + | ||
La société Suse, récemment rachetée par Novell propose un " | La société Suse, récemment rachetée par Novell propose un " | ||
anglais) dédié aux langues asiatiques dites CJK, avec une description | anglais) dédié aux langues asiatiques dites CJK, avec une description | ||
précise de la configuration des différents systèmes | précise de la configuration des différents systèmes | ||
Linux. | Linux. | ||
- | logiciels associés: | + | logiciels associés: |
- | + | ||
- | | + | |
- | En mode <<langue spéciale>>, la séquence de touches est transmise au | + | En mode « langue spéciale |
programme de saisie spécifique qui la transforme en une chaîne de caractère | programme de saisie spécifique qui la transforme en une chaîne de caractère | ||
dans la langue désirée. | dans la langue désirée. | ||
- | + | ||
Il y a une touche qui permet de passer d'une langue à l' | Il y a une touche qui permet de passer d'une langue à l' | ||
combinaison de touches). | combinaison de touches). | ||
- | + | ||
- | L' | + | L' |
ou translittération, | ou translittération, | ||
pour le japonais, Hangul pour le coréen, Zhuyin pour le chinois. | pour le japonais, Hangul pour le coréen, Zhuyin pour le chinois. | ||
saisie de la partie phonétique, | saisie de la partie phonétique, | ||
est offert à l' | est offert à l' | ||
- | + | ||
Voici quelques programmes qui se présentent sous la forme d'un serveur, | Voici quelques programmes qui se présentent sous la forme d'un serveur, | ||
d'un client, et de dictionnaires. Ceux-ci sont disponibles sur toutes les | d'un client, et de dictionnaires. Ceux-ci sont disponibles sur toutes les | ||
machines Linux ou Unix. | machines Linux ou Unix. | ||
- | + | ||
- | \begin{itemize} | + | |
- | \item '' | + | |
- | \item '' | + | |
- | \item '' | + | |
- | \item '' | + | |
- | \item '' | + | |
- | \end{itemize} | + | |
Sur les machines Windows, il faut aller dans | Sur les machines Windows, il faut aller dans | ||
Panneau-de-configuration--Options régionales et installer le chinois. Ne | Panneau-de-configuration--Options régionales et installer le chinois. Ne | ||
- | pas oublier d' | + | pas oublier d' |
- | le japonais par la même occasion. | + | le japonais par la même occasion. |
- | \url{http:// | + | |
- | + | ||
- | Sur les machines Mac, il faut installer le << | + | |
- | (Chinese Language Kit (CLK)). | + | |
- | \url{http:// | + | |
- | + | ||
- | %%%%%%%%%%%%%%%%%%%%%%%% | + | |
- | + | ||
- | \item Le deuxième cas est celui de la saisie de plusieurs langues très | + | |
- | différentes: | + | |
- | et utiliser un éditeur qui le permette \vref{editeur-utf8}. | + | |
- | + | ||
- | Il sera aussi possible d' | + | |
- | '' | + | |
- | + | ||
- | Il est ensuite possible de transcoder le codage Emacs en utf-8 pour le | + | |
- | traitement par < | + | |
- | \end{itemize} | + | |
- | + | ||
- | + | ||
- | ===== Qu' | + | |
- | + | ||
- | + | ||
- | $\Reponse$ | + | |
- | caractères sous forme de nombres ou suite de nombres. | + | |
- | Un des codages très connu est l' | + | |
- | sur des nombres de 0 à 127 (7 bits). | + | |
- | + | ||
- | Ce codage ne permet pas de représenter les caractères accentués utilisés | + | |
- | dans la langue française. | + | |
- | On a donc étendu le codage à 256 (sur 8 bits), et assigné les caractères | + | |
- | régionaux aux nombres de 128 à 256. | + | |
- | + | ||
- | Chaque pays a donc assigné ses caractères locaux et il y a donc des codages | + | |
- | sur 8 bits différents pour chaque pays. | + | |
- | + | ||
- | Les codages connus commencent par ISO-8859 plus un chiffre qui caractérise le | + | |
- | pays (ISO-8859-1 pour le latin sans le signe euro). | + | |
- | + | ||
- | Les codages ont été normalisés maintenant (norme ISO). | + | |
- | + | ||
- | Pour les langues asiatiques qui n' | + | |
- | idéogrammes, | + | |
- | (glyphes) peuvent être codés. Ils ont donc codé leurs glyphes sur 2 octets, ce | + | |
- | qui permet de disposer de 65000 glyphes différents. Plusieurs codages | + | |
- | différents ont été utilisés pour la même langue, et sont utilisés | + | |
- | concurremment (suivant les machines, les régions, les habitudes, les programmes | + | |
- | utilisés), ce qui pose souvent le problème de la récupération des documents | + | |
- | quand des programmes utilisent un codage propriétaire et ne sont plus maintenus. | + | |
- | (voir déjà | + | |
- | (version 2 de '' | + | |
- | les textes sur les nouveaux Macs avec la nouvelle version de '' | + | |
- | + | ||
- | + | ||
- | Le codage sur 8 bits ne permet que l' | + | |
- | dans les cas de langues extrêmement proches comme l' | + | |
- | Il est possible de coder les caractères et accents particuliers de ces deux | + | |
- | langues | + | |
- | + | ||
- | Pour pouvoir utiliser plusieurs langues très différentes simultanément, | + | |
- | utiliser l' | + | |
- | toutes les langues. Le codage se fait sur plusieurs octets, et avec des codages | + | |
- | différents (utf-8, utf-16 etc ...) | + | |
- | + | ||
- | Voir plus loin pour les détails. | + | |
- | + | ||
- | Les programmes de saisie de textes <<non utf-8>> | + | |
- | le passage d'une langue à l' | + | |
- | Ils utilisent pour cela soit le 8ème bit du nombre pour savoir si le caractère | + | |
- | est régional ou pas, ou utilisent un système de balises comme le fait < | + | |
- | + | ||
- | Encore faut-il que ce balisage, codage soit documenté pour la pérennité des | + | |
- | documents saisis. | + | |
- | + | ||
- | Les éditeurs utf-8 utilisent le codage utf-8 pour représenter les glyphes, | + | |
- | caractères, | + | |
- | + | ||
- | + | ||
- | ===== Qu' | + | |
- | + | ||
- | + | ||
- | $\Reponse$ | + | |
- | glyphes (dessins) des caractères sous forme de nombre (l' | + | |
- | qu' | + | |
- | + | ||
- | Il y a donc une correspondance (bijection ...) entre le codage d'un caractère | + | |
- | de texte, et son codage dans la fonte. | + | |
- | + | ||
- | Il y a des quantités de codages, et < | + | |
- | (il assigne les glyphes à sa façon). Il permet en plus d' | + | |
- | virtuelles qui sont composées de caractères piochés dans plusieurs polices. | + | |
- | + | ||
- | Nous verrons plus loin comment expliquer à < | + | |
- | pour le texte, et quel codage est utilisé pour la fonte. | + | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | ===== Comment traiter les textes précédemment saisis avec LaTeX? ===== | + | |
- | + | ||
- | Suivant le codage utilisé pour la saisie, il sera peut-être nécessaire de | + | |
- | procéder à un transcodage du texte. Par exemple, '' | + | |
- | codage propriétaire (mais documenté ! c'est un logiciel GNU). | + | |
- | Il faudra configurer le codage de sauvegarde du texte pour qu'il soit | + | |
- | utilisable par < | + | |
- | '' | + | |
- | + | ||
- | Le paquetage [[ctanpkg> | + | |
- | l' | + | |
- | préciser le codage de la police utilisée. Ce paquetage permet de traiter de | + | |
- | nombreux langages. Se reporter à la documentation de [[ctanpkg> | + | |
- | langues disponibles. | + | |
- | + | ||
- | Voici quelques exemples d' | + | |
- | + | ||
- | \begin{itemize} | + | |
- | \item{ Un exemple de [[ctanpkg> | + | |
- | Le texte a été saisi avec '' | + | |
- | par défaut (FR), et le codage est donc ISO-8859-1. | + | |
- | + | ||
- | + | ||
- | <code latex> | + | |
- | \documentclass{article} | + | |
- | + | ||
- | \usepackage[T1]{fontenc} | + | |
- | \usepackage[latin1]{inputenc} | + | |
- | \usepackage[frenchb]{babel} | + | |
- | + | ||
- | % Commentaire : fin du preambule | + | |
- | + | ||
- | \begin{document} | + | |
- | + | ||
- | \title{Titre de mon article} | + | |
- | \author{Le Monsieur \and La Madame} | + | |
- | \date{Le \today} | + | |
- | \maketitle | + | |
- | + | ||
- | \begin{abstract} | + | |
- | Résumé de mon article, passionnant. | + | |
- | \end{abstract} | + | |
- | + | ||
- | \tableofcontents | + | |
- | + | ||
- | \section{Explications} | + | |
- | + | ||
- | \texttt{fontenc}, | + | |
- | sont des packages permettant d' | + | |
- | les accents. | + | |
- | \texttt{babel} sert à franciser le | + | |
- | document. | + | |
- | + | ||
- | \end{document} | + | |
- | </ | + | |
- | + | ||
- | } | + | |
- | \item Un exemple de '' | + | |
- | Cet exemple a été saisi avec '' | + | |
- | version ---mule--- qui permet de saisir des textes en multiples | + | |
- | langues. Le codage interne est spécifique à '' | + | |
- | il est possible de spécifier avec quel codage on veut que | + | |
- | soit écrit le fichier sur le disque. | + | |
- | Le texte << | + | |
- | comprends pas le chinois) et j'en ai seulement traduit la partie | + | |
- | en anglais. | + | |
- | Le texte a été traité par '' | + | |
- | + | ||
- | Il est difficile de montrer des exemples réels car cette FAQ | + | |
- | est en langage national, et ne gère pas l' | + | |
- | \ldots ! | + | |
- | Une solution serait d' | + | |
- | travail), mais la taille de cette FAQ augmenterait d'une façon | + | |
- | déraisonnable. | + | |
- | + | ||
- | Notez la première ligne du texte qui indique à '' | + | |
- | nature de le codage du texte. | + | |
- | + | ||
- | + | ||
- | <code latex> | + | |
- | + | ||
- | %% -*- coding: emacs-mule -*- | + | |
- | \documentclass[12pt]{article} | + | |
- | \usepackage{times} | + | |
- | \renewcommand{\baselinestretch}{1.2} | + | |
- | + | ||
- | \begin{document} | + | |
- | \Large | + | |
- | \begin{tabular}{l@{\hspace{5em}}l} | + | |
- | texte en chinois \\ | + | |
- | texte en chinois \\[\medskipamount] | + | |
- | chinois traditionnel & chinois simplifié \\ | + | |
- | chinois traditionnel & chinois simplifié \\ | + | |
- | chinois traditionnel & chinois simplifié \\ | + | |
- | chinois traditionnel & chinois simplifié \\ | + | |
- | \end{tabular} | + | |
- | + | ||
- | \bigskip | + | |
- | \normalsize | + | |
- | \noindent | + | |
- | Un poème de Li\v{u} Z\=ong | + | |
- | sur la partie gauche en chinois traditionnel, | + | |
- | à droite en chinois simplifié. | + | |
- | '' | + | |
- | '' | + | |
- | est possible de saisir et d'afficher différents | + | |
- | types de fontes (Big5 pour les caractères | + | |
- | traditionnels, | + | |
- | simplifiés. Dans notre cas, c'est très utile, car | + | |
- | le caractère \emph{\v{a}i} ne fait pas partie de | + | |
- | la police GB2312. | + | |
- | J'ai donc substitué le caractère correspondant de | + | |
- | la fonte Big5. | + | |
- | Le fichier a été exporté en utilisant la fonction | + | |
- | \verb|cjk-write-file| fournie par le paquetage | + | |
- | '' | + | |
- | '' | + | |
- | + | ||
- | Ici, signature en chinois \ldots | + | |
- | + | ||
- | \end{document} | + | |
- | </ | + | |
- | + | ||
- | + | ||
- | \item{Un exemple de '' | + | |
- | Vous pourrez trouver des exemples dans la distribution de | + | |
- | '' | + | |
- | \url{http:// | + | |
- | } | + | |
- | \item{Un exemple de '' | + | |
- | Vous pourrez trouver des exemples dans la distribution | + | |
- | '' | + | |
- | \url{http:// | + | |
- | Linux adorée \ldots | + | |
- | Debian propose un paquetage << | + | |
- | dans la section documentation. | + | |
- | } | + | |
- | + | ||
- | \item{Un exemple de '' | + | |
- | Le texte a été saisi avec '' | + | |
- | + | ||
- | + | ||
- | <code latex> | + | |
- | \documentclass[french, | + | |
- | + | ||
- | \usepackage[notipa]{ucs} | + | |
- | \usepackage[utf8]{inputenc} | + | |
- | \usepackage[T1]{fontenc} | + | |
- | \usepackage[T3, | + | |
- | \usepackage[greek, | + | |
- | + | ||
- | + | ||
- | \title{Un titre} | + | |
- | + | ||
- | \author{Auteur} | + | |
- | + | ||
- | % commande \frt pour écrire du texte français | + | |
- | \newcommand\frt[1]{\foreignlanguage{french}{# | + | |
- | + | ||
- | % commande \rut pour écrire en russe | + | |
- | \newcommand\rut[1]{\foreignlanguage{russian}{# | + | |
- | + | ||
- | % commande grt pour écrire du texte en grec | + | |
- | \newcommand\grt[1]{\foreignlanguage{greek}{# | + | |
- | + | ||
- | % commande \phot pour écrire du texte en alphabet | + | |
- | %phonétique | + | |
- | \newcommand\phot[1]{\bgroup\fontencoding{T3}% | + | |
- | \selectfont\SetUnicodeOption{tipa}# | + | |
- | + | ||
- | + | ||
- | \begin{document} | + | |
- | + | ||
- | \maketitle | + | |
- | + | ||
- | \tableofcontents | + | |
- | + | ||
- | \section{Je suis auteur de textes multilingues et | + | |
- | de dictionnaires: | + | |
- | + | ||
- | La composition de textes multilingues dans le cadre | + | |
- | d' | + | |
- | par \LaTeX doit se faire en '' | + | |
- | c' | + | |
- | + | ||
- | \frt{Russe: | + | |
- | + | ||
- | Ici suit le texte en Unicode (russe) ... | + | |
- | + | ||
- | \rut{ texte en russe } | + | |
- | + | ||
- | + | ||
- | \frt{Grec (en Polytonic)}: | + | |
- | + | ||
- | Ici suit le texte en grec: | + | |
- | + | ||
- | \grt{ texte en grec } | + | |
- | + | ||
- | \end{document} | + | |
- | + | ||
- | </ | + | |
- | + | ||
- | } | + | |
- | + | ||
- | + | ||
- | \end{itemize} | + | |
- | + | ||
- | + | ||
- | + | ||
- | ===== Pouvez-vous donner plus de détails sur les méthodes de saisie? ===== | + | |
- | + | ||
- | + | ||
- | $\Reponse$ | + | |
- | utilisés par la langue sont très supérieurs au nombre de touche d'un clavier. | + | |
- | Ces méthodes de saisie | + | |
- | idéogrammes. | + | |
- | + | ||
- | Le principe de saisie est le suivant: une fois l' | + | |
- | << | + | |
- | mais faire apparaître une fenêtre (menu) qui va proposer différents choix en | + | |
- | fonction de ce qui a déjà été tapé. Il existe de nombreuses méthodes de saisie | + | |
- | qui sont fondées soit sur la phonétique, | + | |
- | combinaison des deux, soit le codage direct des caractères. | + | |
- | + | ||
- | Une bonne méthode de saisie doit se contenter d'un nombre réduit de touches, | + | |
- | comme 26 touches par exemple. (disponibles sur des claviers occidentaux) | + | |
- | + | ||
- | Voyons les méthodes de saisie suivant les langues: | + | |
- | + | ||
- | + | ||
- | ==== Quelles sont les méthodes de saisie du chinois? ==== | + | |
- | + | ||
- | + | ||
- | $\Reponse$ | + | |
- | \url{http:// | + | |
- | traduites car je ne suis en aucun cas un spécialiste des langues orientales. | + | |
- | + | ||
- | \begin{itemize} | + | |
- | \item{Méthodes fondées sur la phonétique: | + | |
- | \begin{itemize} | + | |
- | \item{pinyin: | + | |
- | Unies. elle utilise les caractères trouvés sur les | + | |
- | claviers occidentaux en association avec le << | + | |
- | Le << | + | |
- | est assez verbeuse: zhong + guo or zhong1 + guo2 pour | + | |
- | 2 glyphes originaux. | + | |
- | | + | |
- | possible de préciser le ton avec un chiffre à la fin | + | |
- | du son comme écrit ci-dessus. Sur la page citée juste | + | |
- | au-dessus, vous pourrez trouver plus de détails sur | + | |
- | le positionnement des << | + | |
- | \item{shuangpin: | + | |
- | avec une réduction sensible du nombre de touches à | + | |
- | taper. En général, une ou deux touches suffisent.} | + | |
- | \item{jianpin: | + | |
- | les deux précédentes. Voici un tableau de comparaison | + | |
- | entre les 3 méthodes pour les mêmes glyphes: | + | |
- | + | ||
- | \begin{tabular}{|c|c|c|c|} | + | |
- | | + | |
- | Hanzi & Pinyin & ShuangPin & JianPin \\ | + | |
- | \hline | + | |
- | glyphe & a & a & a \\ | + | |
- | glyphe & ku & ku & ku \\ | + | |
- | glyphe & chu & uu & iu \\ | + | |
- | glyphe & cuan & cc & cuj \\ | + | |
- | glyphe & zhang & ag & ah \\ | + | |
- | glyphe & shuang & ih & uuh \\ | + | |
- | \hline | + | |
- | \end{tabular} | + | |
- | + | ||
- | } | + | |
- | \item{bopomofo: | + | |
- | et modifiée de nombreuses fois ensuite. Elle est | + | |
- | toujours d' | + | |
- | officielle d' | + | |
- | sur des formes calligraphiques dont certaines sont | + | |
- | dérivées de caractères d' | + | |
- | + | ||
- | La méthode repose sur 37 symboles, 21 consonnes, 16 | + | |
- | voyelles et 5 tons. | + | |
- | Le grand désavantage de cette méthode est qu' | + | |
- | nécessite un clavier spécifique, | + | |
- | ne sont pas disponibles sur un clavier occidental. | + | |
- | } | + | |
- | \end{itemize} | + | |
- | } | + | |
- | \item{Méthodes fondées sur la structure:: | + | |
- | \begin{itemize} | + | |
- | \item{wubizixing: | + | |
- | peut être saisi par au plus 4 appuis de touches (2 au | + | |
- | minimum). | + | |
- | À chaque glyphe est associé une combinaison unique | + | |
- | d' | + | |
- | + | ||
- | Cette méthode divise le radical en 5 groupes, eux-même | + | |
- | divisés en 5 groupes. Ils sont assignés aux touches | + | |
- | de A à Y. La touche Z sert d' | + | |
- | + | ||
- | + | ||
- | Voici un tableau de présentation: | + | |
- | + | ||
- | + | ||
- | \begin{tabular}{|c|c|c|c|c|c|} | + | |
- | \hline | + | |
- | & Key 1 & Key 2 & Key 3 & Key 4 & Key 5 \\ | + | |
- | G1 & 1 1/G & 1 2/F & 1 3/D & 1 4/S & 1 5/A \\ | + | |
- | G2 & 2 1/H & 2 2/J & 2 3/K & 2 4/L & 2 5/M \\ | + | |
- | G3 & 3 1/T & 3 2/R & 3 3/E & 3 4/W & 3 5/Q \\ | + | |
- | G4 & 4 1/Y & 4 2/U & 4 3/I & 4 4/O & 4 5/P \\ | + | |
- | G5 & 5 1/N & 5 2/B & 5 3/V & 5 4/C & 5 5/X \\ | + | |
- | \hline | + | |
- | \end{tabular} | + | |
- | } | + | |
- | + | ||
- | \item{wubihua: | + | |
- | (chiffre de 1 à 5 ; 6 est le caractère d' | + | |
- | À chaque chiffre est associé une partie de base du | + | |
- | glyphe; En fait, le dessin du glyphe est décomposé | + | |
- | comme pour une écriture manuelle, et à chaque chiffre | + | |
- | est associé un mouvement. La lettre T française peut | + | |
- | être décomposée en une barre verticale et une | + | |
- | horizontale. C'est le même principe. Il suffit d' | + | |
- | les 5 chiffres consécutifs de la constitution du glyphe | + | |
- | suivi du caractère d' | + | |
- | + | ||
- | Voir le tableau de correspondance sur le site précité. | + | |
- | } | + | |
- | \item{cangjie: | + | |
- | groupes assignés aux touches suivant cette liste: | + | |
- | + | ||
- | + | ||
- | La traduction est certainement approximative \ldots | + | |
- | \begin{itemize} | + | |
- | \item{groupe philosophique (A, B, C, D, E, F, G)} | + | |
- | \item{groupe du trait de crayon (H, I, J, K, L, M, N)} | + | |
- | \item{groupe des parties du corps (O, P, Q, R)} | + | |
- | \item{groupe du contour du caractère(S, | + | |
- | \end{itemize} | + | |
- | } | + | |
- | \item{sucheng: | + | |
- | une économie de touches à taper. } | + | |
- | \item{boshiamy: | + | |
- | utilise les 26 touches du clavier. Elle tient compte | + | |
- | de la forme du glyphe, de sa prononciation, | + | |
- | signification. Chaque glyphe nécessite l' | + | |
- | 4 touches du clavier.} | + | |
- | \item{dayi: | + | |
- | disponibles du clavier, ce qui est un inconvénient. | + | |
- | Seuls 2 appuis de touches sont nécessaires pour la | + | |
- | saisie d'un glyphe.} | + | |
- | \item{sanjiao: | + | |
- | dérivée de la méthode des 4 coins, utilisée | + | |
- | pour la recherche de glyphes dans un dictionnaire.} | + | |
- | \end{itemize} | + | |
- | } | + | |
- | \item{Méthodes fondées sur une combinaison phonétique--structure: | + | |
- | Pas de détails trouvés. | + | |
- | \begin{itemize} | + | |
- | \item{tze-loi: | + | |
- | \item{renzhi: | + | |
- | \end{itemize} | + | |
- | } | + | |
- | + | ||
- | \item{Méthodes de saisie directe: | + | |
- | Pas de détails trouvés. | + | |
- | \begin{itemize} | + | |
- | \item{dianbaoma: | + | |
- | \item{guojiquweima: | + | |
- | \item{neima: | + | |
- | \end{itemize} | + | |
- | } | + | |
- | + | ||
- | \end{itemize} | + | |
- | + | ||
- | + | ||
- | + | ||
- | ==== Quelles sont les méthodes de saisie du japonais? ==== | + | |
- | + | ||
- | + | ||
- | + | ||
- | $\Reponse$ | + | |
- | caractères romains , et le programme qui supporte la méthode de saisie propose | + | |
- | le glyphe correspondant qui existe en trois versions: hiraganas, katakanas ou | + | |
- | kanjis. | + | |
- | + | ||
- | Les informations suivantes ont été trouvées sur la page suivante: | + | |
- | http:// | + | |
- | + | ||
- | Le japonais utilise 3 systèmes d' | + | |
- | + | ||
- | * **Hiraganas**: | + | |
- | * **Katakanas**: | + | |
- | * **Kanjis**: système identique au chinois(idéogrammes) qui associe à chaque glyphe un mot, un sens sans aucune équivoque possible. | + | |
- | + | ||
- | Voir cette page qui donne quelques informations supplémentaires: | + | |
- | http:// | + | |
- | + | ||
- | + | ||
- | ==== Quelles sont les méthodes de saisie du russe? ==== | + | |
- | + | ||
- | + | ||
- | $\Reponse$ | + | |
- | celles dérivées.) | + | |
- | + | ||
- | C'est une méthode simple, car il y a correspondance directe entre les touches | + | |
- | dessinées sur le clavier et le caractère correspondant. | + | |
- | + | ||
- | Pour le russe, j'ai aussi vu une méthode de translittération qui traduisait | + | |
- | les suites de caractères romains en caractères cyrilliques (méthode phonétique). | + | |
- | Un tel mode est disponible dans '' | + | |
- | + | ||
- | + | ||
- | + | ||
- | ==== Quelle est la méthode de saisie du grec? ==== | + | |
- | + | ||
- | + | ||
- | $\Reponse$ | + | |
- | à une touche. Le clavier peut ici se trouver en deux états: clavier romain | + | |
- | (latin) et clavier grec. Une touche (combinaison de touches) permet de commuter | + | |
- | d'un mode à l' | + | |
- | caractères. | + | |
- | + | ||
- | + | ||
- | ==== Quelles sont les méthodes de saisie du coréen? ==== | + | |
- | + | ||
- | $\Reponse$ | + | |
- | + | ||
- | * **ASCII**: pour les caractères anglais. | + | |
- | * **Hangul**: les glyphes sont constitués d'une consonne suivie d'une voyelle avec une finale consonnique optionnelle. Il y a une vérification de la conformité du glyphe (son en cas d' | + | |
- | * **Hanja**: les glyphes Hanja ne peuvent être obtenus qu'à partir des glyphes Hangul. Il y a deux modes de conversion: simple et multiple. En cas de choix multiples, une liste est proposée. | + | |
- | + | ||
- | + | ||
- | ==== Quelles sont les méthodes de saisie du vietnamien? ==== | + | |
- | + | ||
- | + | ||
- | $\Reponse$ | + | |
- | mais modifiée pour supporter les particularités de la langue. elle vérifie | + | |
- | la conformité des caractères saisis. Il y a des << | + | |
- | certaines voyelles. | + | |
- | ( a, e, i, o, u, y, a-circumflex, | + | |
- | or u-horn) | + | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | ===== Pouvez-vous donner plus de détails sur Unicode? ===== | + | |
- | + | ||
- | + | ||
- | $\Reponse$ | + | |
- | * http:// | + | |
- | * http:// | + | |
- | + | ||
- | Il y a aussi des listes de diffusion consacrées à Unicode. Voir votre | + | |
- | lecteur de << | + | |
- | + | ||
- | + | ||
- | + | ||
- | ==== Comment configurer la saisie des idéogrammes orientaux sur Windows? ==== | + | |
- | + | ||
- | + | ||
- | $\Reponse$ | + | |
- | l'URL suivante: http:// | + | |
- | (en anglais). | + | |
- | + | ||
- | + | ||
- | + | ||
- | ==== Comment configurer la saisie des idéogrammes orientaux sur Mac? ==== | + | |
- | + | ||
- | + | ||
- | $\Reponse$ | + | |
- | l'URL suivante: \url{http:// | + | |
- | + | ||
- | + | ||
- | ==== Comment configurer la saisie des idéogrammes orientaux sur Linux/Unix} ==== | + | |
- | + | ||
- | $\Reponse$ | + | |
- | de configuration et d' | + | |
- | disponibles sous forme de paquetages sur toutes les distributions. | + | |
- | + | ||
- | * http:// | + | |
- | * http:// | + | |
- | * Voir le «debian chinese HOWTO» sur le site http:// | + | |
- | + | ||
- | + | ||
- | ===== Quels sont les problèmes de codage des textes? ===== | + | |
- | + | ||
- | $\Reponse$ | + | |
- | avec < | + | |
- | texte sera accepté par < | + | |
- | Vous avez plusieurs possibilités suivant l' | + | |
- | + | ||
- | \begin{itemize} | + | |
- | \item{Vous avez utilisé un éditeur utf-8: là, vous avez le | + | |
- | choix d' | + | |
- | faut savoir que toutes les langues ne sont pas supportées | + | |
- | par ce programme. Une facilité est apportée par le paquetage | + | |
- | optionnel \emph{autofe} de '' | + | |
- | d'une langue à l' | + | |
- | \item{Vous avez utilisé un éditeur utf-8 mais les langues | + | |
- | que vous utilisez ne sont pas traitées par '' | + | |
- | ou \OMEGA. Il vous faut utiliser un convertisseur de codage | + | |
- | comme '' | + | |
- | d' | + | |
- | permet de choisir le codage de sauvegarde du fichier, qui peut | + | |
- | être différent de celui de la saisie. Voir '' | + | |
- | exemple. Vous transcoderez votre texte par exemple en codage | + | |
- | CJK et traiterez le texte avec '' | + | |
- | le même pour '' | + | |
- | \item{Vous avez saisi votre texte avec un éditeur spécialisé, | + | |
- | non utf-8, mais dont le codage est connu. Alors, soit l' | + | |
- | permet de spécifier le codage de sauvegarde, soit il faut | + | |
- | utiliser un convertisseur. } | + | |
- | \item{Vous utilisez un éditeur << | + | |
- | d' | + | |
- | facilité d' | + | |
- | programme... C'est inutilisable! (Qui a dit '' | + | |
- | %j' | + | |
- | \end{itemize} | + | |
- | + | ||
- | + | ||
- | ===== Pouvez-vous donner des exemples d' | + | |
- | + | ||
- | + | ||
- | ===== Pouvez-vous donner des exemples d' | + | |
- | + | ||
- | + | ||
- | ===== Pouvez-vous donner des exemples d' | + | |
+ | Sur les machines Mac, il faut installer le « CLK » | ||
+ | (Chinese Language Kit (CLK)). | ||
- | ===== Pouvez-vous donner des exemples d' | ||
- | ===== Pouvez-vous donner des exemples d' | ||
- | {{htmlmetatags> | + | {{htmlmetatags> |
- | metatag-og: | + | metatag-og: |
metatag-og: | metatag-og: | ||
}} | }} | ||