Différences
Ci-dessous, les différences entre deux révisions de la page.
| Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
| 2_composition:langues:multilinguisme:editer_textes_multilingues [2021/02/10 18:39] – Suppression de ce qui ne concerne pas l'édition. jejust | 3_composition:langues:multilinguisme:editer_textes_multilingues [2021/05/09 11:04] (Version actuelle) – [Généralités] bdumont | ||
|---|---|---|---|
| Ligne 1: | Ligne 1: | ||
| - | ====== Comment | + | ====== Comment |
| - | FIXME Page très riche, mais beaucoup trop longue ! Découper en pages plus précises et transformer celle-ci en page chapeau avec des liens vers les autres pages. | + | ===== Généralités ===== |
| + | La composition du texte se fait à l'aide d'un éditeur. Cet éditeur doit | ||
| + | permettre la saisie des caractères, | ||
| + | Grâce au support de l' | ||
| + | exactement comme ils doivent être imprimés et non en [[https:// | ||
| + | Aujourd' | ||
| + | de quelques mots, sauf dans de rares cas où une extension offre des fonctionnalités reposant sur | ||
| + | un encodage en beta code que l'on ne pourrait pas avoir avec une saisie directe des caractères | ||
| + | (p. ex. avec [[ctanpkg> | ||
| + | |||
| + | Nous nous intéressons ici uniquement à la saisie directe des caractères unicodes, en envisageant plusieurs cas. | ||
| + | Si vous souhaitez saisir du texte en beta code, vous pouvez [[3_composition/ | ||
| + | et vous référer à la documentation des extensions correspondantes. FIXME //Préciser où on peut trouver les infos// | ||
| - | $\Reponse$ | + | ==== Saisie |
| - | plusieurs parties avec chacune leurs problèmes. En premier lieu | + | |
| - | vient la saisie des documents. Ensuite vient une phase éventuelle | + | |
| - | de transcodage, | + | |
| - | la gestion des fontes de caractères avec leur codage qui est | + | |
| - | différent pour l' | + | |
| - | ou la conversion en un type différent de document comme | + | |
| - | les documents '' | + | |
| - | solutions Linux/Unix, car je n'ai ni Windows, ni Mac | + | |
| - | ...mais j' | + | |
| - | systèmes d' | + | |
| + | Le premier cas est celui de la saisie de deux langues différentes. | ||
| - | ===== Comment éditer les textes multilingues? | + | === Éditeur de texte === |
| - | + | ||
| - | + | ||
| - | $\Reponse$ | + | |
| - | + | ||
| - | La composition du texte se fait à l'aide d'un éditeur. Cet éditeur doit | + | |
| - | permettre la saisie des caractères, | + | |
| - | me semble extrêmement important est que les caractères apparaissent | + | |
| - | exactement comme ils doivent être imprimés et non comme une suite de | + | |
| - | caractères sans signification (voir l' | + | |
| - | cette même section.) | + | |
| - | + | ||
| - | Nous pouvons distinguer 2 cas: | + | |
| - | + | ||
| - | \begin{itemize} | + | |
| - | %%%%%%%%%%%%%%%%%%%%%%% | + | |
| - | \item Le premier cas est celui de la saisie de deux langues différentes. Une | + | |
| - | des langues sera presque obligatoirement l' | + | |
| - | par cas si le français peut être la langue principale), | + | |
| - | être une langue comme une autre langue européenne, | + | |
| - | ou autre. | + | |
| - | + | ||
| - | %%%%%%%%%%%%%%% | + | |
| La saisie des langues européennes pourra se faire avec n' | La saisie des langues européennes pourra se faire avec n' | ||
| éditeur généraliste à condition de disposer des fontes de caractères | éditeur généraliste à condition de disposer des fontes de caractères | ||
| - | correspondantes. | + | correspondantes. |
| - | langues dont l' | + | un encodage UTF-8 par défaut, on ne devrait pas rencontrer |
| - | (Emacs-mule). | + | à partir du moment où l'on utilise |
| + | ciblée. | ||
| - | Pour ces langues | + | === Clavier === |
| - | clavier. Une applet est disponible dans le <<panel>>, que ce soit pour | + | |
| - | Linux, mac ou | + | Pour une saisie ponctuelle, une solution peut être utiliser un clavier virtuel |
| - | Windows. | + | en ligne, comme ceux du site [[https:// |
| + | souhaite saisir de longs textes, il peut être plus pratique de changer sa | ||
| + | disposition de clavier sur son ordinateur. | ||
| + | |||
| + | Pour les langues | ||
| + | clavier. Une applet est disponible dans le « panel », que ce soit pour | ||
| + | Linux, mac ou Windows. | ||
| Sous Linux, il faut installer les fontes de caractères | Sous Linux, il faut installer les fontes de caractères | ||
| correspondantes, | correspondantes, | ||
| - | clavier (kde, gnome) ou installer un programme indépendant de commutation | + | clavier (KDE, Gnome) ou installer un programme indépendant de commutation |
| - | de claviers. | + | de claviers. Référez-vous à la documentation de votre environnement de bureau. |
| Sous Windows, il faut aller dans le panneau de | Sous Windows, il faut aller dans le panneau de | ||
| Ligne 62: | Ligne 50: | ||
| Sous Mac, la procédure doit être identique. | Sous Mac, la procédure doit être identique. | ||
| - | Il y a juste une correspondance touche | + | On peut alors soit apprendre par cœur la disposition des touches sur le clavier, |
| - | Nous avons sur les ordinateurs vendus en France | + | soit acheter |
| - | dispose | + | que l'on peut coller sur les touches |
| - | + | ||
| - | Je dispose (personnellement) | + | |
| - | deux gravures de lettres: en noir, le clavier | + | |
| - | «qwerty» standard, et en lettres rouges, le clavier propose les lettres | + | |
| - | cyrilliques. | + | |
| - | + | ||
| - | Des claviers spécifiques à chaque langue se trouvent sur internet, mais | + | |
| - | dans les deux dispositions de touches, il y a toujours l' | + | |
| - | Pour l' | + | ==== Écrire |
| - | de deux claviers si l'on veut disposer de la disposition propre | + | |
| - | langue. | + | |
| - | Windows, merci de compléter. | + | |
| - | + | ||
| - | %%%%%%%%%%%%%%%%%%%%%%%% | + | |
| Pour les langues comme l' | Pour les langues comme l' | ||
| - | gauche, il existe des éditeurs spécialisés. | + | gauche, un éditeur généraliste moderne devrait faire l' |
| - | + | Toutefois, il existe | |
| + | quand les éditeurs généralistes offraient un support limité. Peut-être | ||
| + | certains offrent-ils encore des fonctionnalités intéressantes. | ||
| Voici quelques références d' | Voici quelques références d' | ||
| d' | d' | ||
| - | |||
| - | \begin{itemize} | ||
| - | \item '' | ||
| - | \url{http:// | ||
| - | \item '' | ||
| - | \url{http:// | ||
| - | recense de nombreux autres éditeurs commerciaux ou non, ainsi que des | ||
| - | fontes et utilitaires; | ||
| - | \item Il faut bien sûr y ajouter les éditeurs généraux comme '' | ||
| - | '' | ||
| - | langues. | ||
| - | \item '' | ||
| - | Windows--- | ||
| - | \item '' | ||
| - | \url{http:// | ||
| - | ---Linux--- | ||
| - | % \item ''?'' | ||
| - | \end{itemize} | ||
| - | %%%%%%%%%%%%%%%%%%%%%%%% | + | * '' |
| + | * '' | ||
| + | * Pour l' | ||
| + | * '' | ||
| + | * '' | ||
| + | |||
| + | ==== Langues à idéogrammes ==== | ||
| + | |||
| + | FIXME Il serait bon que quelqu' | ||
| La saisie de textes en langue orientale (à idéogrammes) nécessite | La saisie de textes en langue orientale (à idéogrammes) nécessite | ||
| Ligne 118: | Ligne 86: | ||
| un mélange des deux méthodes. Ce programme s'aide de dictionnaires de mots, | un mélange des deux méthodes. Ce programme s'aide de dictionnaires de mots, | ||
| de dictionnaires de phrases qu'il est possible d' | de dictionnaires de phrases qu'il est possible d' | ||
| - | + | ||
| Je détaillerai un peu plus loin. | Je détaillerai un peu plus loin. | ||
| - | + | ||
| La société Suse, récemment rachetée par Novell propose un " | La société Suse, récemment rachetée par Novell propose un " | ||
| anglais) dédié aux langues asiatiques dites CJK, avec une description | anglais) dédié aux langues asiatiques dites CJK, avec une description | ||
| précise de la configuration des différents systèmes | précise de la configuration des différents systèmes | ||
| Linux. | Linux. | ||
| - | logiciels associés: | + | logiciels associés: |
| - | + | ||
| - | | + | |
| - | En mode <<langue spéciale>>, la séquence de touches est transmise au | + | En mode « langue spéciale |
| programme de saisie spécifique qui la transforme en une chaîne de caractère | programme de saisie spécifique qui la transforme en une chaîne de caractère | ||
| dans la langue désirée. | dans la langue désirée. | ||
| - | + | ||
| Il y a une touche qui permet de passer d'une langue à l' | Il y a une touche qui permet de passer d'une langue à l' | ||
| combinaison de touches). | combinaison de touches). | ||
| - | + | ||
| - | L' | + | L' |
| ou translittération, | ou translittération, | ||
| pour le japonais, Hangul pour le coréen, Zhuyin pour le chinois. | pour le japonais, Hangul pour le coréen, Zhuyin pour le chinois. | ||
| saisie de la partie phonétique, | saisie de la partie phonétique, | ||
| est offert à l' | est offert à l' | ||
| - | + | ||
| Voici quelques programmes qui se présentent sous la forme d'un serveur, | Voici quelques programmes qui se présentent sous la forme d'un serveur, | ||
| d'un client, et de dictionnaires. Ceux-ci sont disponibles sur toutes les | d'un client, et de dictionnaires. Ceux-ci sont disponibles sur toutes les | ||
| machines Linux ou Unix. | machines Linux ou Unix. | ||
| - | + | ||
| - | \begin{itemize} | + | |
| - | \item '' | + | |
| - | \item '' | + | |
| - | \item '' | + | |
| - | \item '' | + | |
| - | \item '' | + | |
| - | \end{itemize} | + | |
| Sur les machines Windows, il faut aller dans | Sur les machines Windows, il faut aller dans | ||
| Panneau-de-configuration--Options régionales et installer le chinois. Ne | Panneau-de-configuration--Options régionales et installer le chinois. Ne | ||
| - | pas oublier d' | + | pas oublier d' |
| - | le japonais par la même occasion. | + | le japonais par la même occasion. |
| - | \url{http:// | + | |
| - | + | ||
| - | Sur les machines Mac, il faut installer le << | + | |
| - | (Chinese Language Kit (CLK)). | + | |
| - | \url{http:// | + | |
| - | + | ||
| - | %%%%%%%%%%%%%%%%%%%%%%%% | + | |
| - | + | ||
| - | \item Le deuxième cas est celui de la saisie de plusieurs langues très | + | |
| - | différentes: | + | |
| - | et utiliser un éditeur qui le permette \vref{editeur-utf8}. | + | |
| - | + | ||
| - | Il sera aussi possible d' | + | |
| - | '' | + | |
| - | + | ||
| - | Il est ensuite possible de transcoder le codage Emacs en utf-8 pour le | + | |
| - | traitement par < | + | |
| - | \end{itemize} | + | |
| - | + | ||
| - | + | ||
| - | ===== Qu' | + | |
| - | + | ||
| - | + | ||
| - | $\Reponse$ | + | |
| - | caractères sous forme de nombres ou suite de nombres. | + | |
| - | Un des codages très connu est l' | + | |
| - | sur des nombres de 0 à 127 (7 bits). | + | |
| - | + | ||
| - | Ce codage ne permet pas de représenter les caractères accentués utilisés | + | |
| - | dans la langue française. | + | |
| - | On a donc étendu le codage à 256 (sur 8 bits), et assigné les caractères | + | |
| - | régionaux aux nombres de 128 à 256. | + | |
| - | + | ||
| - | Chaque pays a donc assigné ses caractères locaux et il y a donc des codages | + | |
| - | sur 8 bits différents pour chaque pays. | + | |
| - | + | ||
| - | Les codages connus commencent par ISO-8859 plus un chiffre qui caractérise le | + | |
| - | pays (ISO-8859-1 pour le latin sans le signe euro). | + | |
| - | + | ||
| - | Les codages ont été normalisés maintenant (norme ISO). | + | |
| - | + | ||
| - | Pour les langues asiatiques qui n' | + | |
| - | idéogrammes, | + | |
| - | (glyphes) peuvent être codés. Ils ont donc codé leurs glyphes sur 2 octets, ce | + | |
| - | qui permet de disposer de 65000 glyphes différents. Plusieurs codages | + | |
| - | différents ont été utilisés pour la même langue, et sont utilisés | + | |
| - | concurremment (suivant les machines, les régions, les habitudes, les programmes | + | |
| - | utilisés), ce qui pose souvent le problème de la récupération des documents | + | |
| - | quand des programmes utilisent un codage propriétaire et ne sont plus maintenus. | + | |
| - | (voir déjà | + | |
| - | (version 2 de '' | + | |
| - | les textes sur les nouveaux Macs avec la nouvelle version de '' | + | |
| - | + | ||
| - | + | ||
| - | Le codage sur 8 bits ne permet que l' | + | |
| - | dans les cas de langues extrêmement proches comme l' | + | |
| - | Il est possible de coder les caractères et accents particuliers de ces deux | + | |
| - | langues | + | |
| - | + | ||
| - | Pour pouvoir utiliser plusieurs langues très différentes simultanément, | + | |
| - | utiliser l' | + | |
| - | toutes les langues. Le codage se fait sur plusieurs octets, et avec des codages | + | |
| - | différents (utf-8, utf-16 etc ...) | + | |
| - | + | ||
| - | Voir plus loin pour les détails. | + | |
| - | + | ||
| - | Les programmes de saisie de textes <<non utf-8>> | + | |
| - | le passage d'une langue à l' | + | |
| - | Ils utilisent pour cela soit le 8ème bit du nombre pour savoir si le caractère | + | |
| - | est régional ou pas, ou utilisent un système de balises comme le fait < | + | |
| - | + | ||
| - | Encore faut-il que ce balisage, codage soit documenté pour la pérennité des | + | |
| - | documents saisis. | + | |
| - | + | ||
| - | Les éditeurs utf-8 utilisent le codage utf-8 pour représenter les glyphes, | + | |
| - | caractères, | + | |
| - | + | ||
| - | + | ||
| - | ===== Qu' | + | |
| - | + | ||
| - | + | ||
| - | $\Reponse$ | + | |
| - | glyphes (dessins) des caractères sous forme de nombre (l' | + | |
| - | qu' | + | |
| - | + | ||
| - | Il y a donc une correspondance (bijection ...) entre le codage d'un caractère | + | |
| - | de texte, et son codage dans la fonte. | + | |
| - | + | ||
| - | Il y a des quantités de codages, et < | + | |
| - | (il assigne les glyphes à sa façon). Il permet en plus d' | + | |
| - | virtuelles qui sont composées de caractères piochés dans plusieurs polices. | + | |
| - | + | ||
| - | Nous verrons plus loin comment expliquer à < | + | |
| - | pour le texte, et quel codage est utilisé pour la fonte. | + | |
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | ||
| - | ===== Comment traiter les textes précédemment saisis avec LaTeX? ===== | + | |
| - | + | ||
| - | Suivant le codage utilisé pour la saisie, il sera peut-être nécessaire de | + | |
| - | procéder à un transcodage du texte. Par exemple, '' | + | |
| - | codage propriétaire (mais documenté ! c'est un logiciel GNU). | + | |
| - | Il faudra configurer le codage de sauvegarde du texte pour qu'il soit | + | |
| - | utilisable par < | + | |
| - | '' | + | |
| - | + | ||
| - | Le paquetage [[ctanpkg> | + | |
| - | l' | + | |
| - | préciser le codage de la police utilisée. Ce paquetage permet de traiter de | + | |
| - | nombreux langages. Se reporter à la documentation de [[ctanpkg> | + | |
| - | langues disponibles. | + | |
| - | + | ||
| - | Voici quelques exemples d' | + | |
| - | + | ||
| - | \begin{itemize} | + | |
| - | \item{ Un exemple de [[ctanpkg> | + | |
| - | Le texte a été saisi avec '' | + | |
| - | par défaut (FR), et le codage est donc ISO-8859-1. | + | |
| - | + | ||
| - | + | ||
| - | <code latex> | + | |
| - | \documentclass{article} | + | |
| - | + | ||
| - | \usepackage[T1]{fontenc} | + | |
| - | \usepackage[latin1]{inputenc} | + | |
| - | \usepackage[frenchb]{babel} | + | |
| - | + | ||
| - | % Commentaire : fin du preambule | + | |
| - | + | ||
| - | \begin{document} | + | |
| - | + | ||
| - | \title{Titre de mon article} | + | |
| - | \author{Le Monsieur \and La Madame} | + | |
| - | \date{Le \today} | + | |
| - | \maketitle | + | |
| - | + | ||
| - | \begin{abstract} | + | |
| - | Résumé de mon article, passionnant. | + | |
| - | \end{abstract} | + | |
| - | + | ||
| - | \tableofcontents | + | |
| - | + | ||
| - | \section{Explications} | + | |
| - | + | ||
| - | \texttt{fontenc}, | + | |
| - | sont des packages permettant d' | + | |
| - | les accents. | + | |
| - | \texttt{babel} sert à franciser le | + | |
| - | document. | + | |
| - | + | ||
| - | \end{document} | + | |
| - | </ | + | |
| - | + | ||
| - | } | + | |
| - | \item Un exemple de '' | + | |
| - | Cet exemple a été saisi avec '' | + | |
| - | version ---mule--- qui permet de saisir des textes en multiples | + | |
| - | langues. Le codage interne est spécifique à '' | + | |
| - | il est possible de spécifier avec quel codage on veut que | + | |
| - | soit écrit le fichier sur le disque. | + | |
| - | Le texte << | + | |
| - | comprends pas le chinois) et j'en ai seulement traduit la partie | + | |
| - | en anglais. | + | |
| - | Le texte a été traité par '' | + | |
| - | + | ||
| - | Il est difficile de montrer des exemples réels car cette FAQ | + | |
| - | est en langage national, et ne gère pas l' | + | |
| - | \ldots ! | + | |
| - | Une solution serait d' | + | |
| - | travail), mais la taille de cette FAQ augmenterait d'une façon | + | |
| - | déraisonnable. | + | |
| - | + | ||
| - | Notez la première ligne du texte qui indique à '' | + | |
| - | nature de le codage du texte. | + | |
| - | + | ||
| - | + | ||
| - | <code latex> | + | |
| - | + | ||
| - | %% -*- coding: emacs-mule -*- | + | |
| - | \documentclass[12pt]{article} | + | |
| - | \usepackage{times} | + | |
| - | \renewcommand{\baselinestretch}{1.2} | + | |
| - | + | ||
| - | \begin{document} | + | |
| - | \Large | + | |
| - | \begin{tabular}{l@{\hspace{5em}}l} | + | |
| - | texte en chinois \\ | + | |
| - | texte en chinois \\[\medskipamount] | + | |
| - | chinois traditionnel & chinois simplifié \\ | + | |
| - | chinois traditionnel & chinois simplifié \\ | + | |
| - | chinois traditionnel & chinois simplifié \\ | + | |
| - | chinois traditionnel & chinois simplifié \\ | + | |
| - | \end{tabular} | + | |
| - | + | ||
| - | \bigskip | + | |
| - | \normalsize | + | |
| - | \noindent | + | |
| - | Un poème de Li\v{u} Z\=ong | + | |
| - | sur la partie gauche en chinois traditionnel, | + | |
| - | à droite en chinois simplifié. | + | |
| - | '' | + | |
| - | '' | + | |
| - | est possible de saisir et d'afficher différents | + | |
| - | types de fontes (Big5 pour les caractères | + | |
| - | traditionnels, | + | |
| - | simplifiés. Dans notre cas, c'est très utile, car | + | |
| - | le caractère \emph{\v{a}i} ne fait pas partie de | + | |
| - | la police GB2312. | + | |
| - | J'ai donc substitué le caractère correspondant de | + | |
| - | la fonte Big5. | + | |
| - | Le fichier a été exporté en utilisant la fonction | + | |
| - | \verb|cjk-write-file| fournie par le paquetage | + | |
| - | '' | + | |
| - | '' | + | |
| - | + | ||
| - | Ici, signature en chinois \ldots | + | |
| - | + | ||
| - | \end{document} | + | |
| - | </ | + | |
| - | + | ||
| - | + | ||
| - | \item{Un exemple de '' | + | |
| - | Vous pourrez trouver des exemples dans la distribution de | + | |
| - | '' | + | |
| - | \url{http:// | + | |
| - | } | + | |
| - | \item{Un exemple de '' | + | |
| - | Vous pourrez trouver des exemples dans la distribution | + | |
| - | '' | + | |
| - | \url{http:// | + | |
| - | Linux adorée \ldots | + | |
| - | Debian propose un paquetage << | + | |
| - | dans la section documentation. | + | |
| - | } | + | |
| - | + | ||
| - | \item{Un exemple de '' | + | |
| - | Le texte a été saisi avec '' | + | |
| - | + | ||
| - | + | ||
| - | <code latex> | + | |
| - | \documentclass[french, | + | |
| - | + | ||
| - | \usepackage[notipa]{ucs} | + | |
| - | \usepackage[utf8]{inputenc} | + | |
| - | \usepackage[T1]{fontenc} | + | |
| - | \usepackage[T3, | + | |
| - | \usepackage[greek, | + | |
| - | + | ||
| - | + | ||
| - | \title{Un titre} | + | |
| - | + | ||
| - | \author{Auteur} | + | |
| - | + | ||
| - | % commande \frt pour écrire du texte français | + | |
| - | \newcommand\frt[1]{\foreignlanguage{french}{# | + | |
| - | + | ||
| - | % commande \rut pour écrire en russe | + | |
| - | \newcommand\rut[1]{\foreignlanguage{russian}{# | + | |
| - | + | ||
| - | % commande grt pour écrire du texte en grec | + | |
| - | \newcommand\grt[1]{\foreignlanguage{greek}{# | + | |
| - | + | ||
| - | % commande \phot pour écrire du texte en alphabet | + | |
| - | %phonétique | + | |
| - | \newcommand\phot[1]{\bgroup\fontencoding{T3}% | + | |
| - | \selectfont\SetUnicodeOption{tipa}# | + | |
| - | + | ||
| - | + | ||
| - | \begin{document} | + | |
| - | + | ||
| - | \maketitle | + | |
| - | + | ||
| - | \tableofcontents | + | |
| - | + | ||
| - | \section{Je suis auteur de textes multilingues et | + | |
| - | de dictionnaires: | + | |
| - | + | ||
| - | La composition de textes multilingues dans le cadre | + | |
| - | d' | + | |
| - | par \LaTeX doit se faire en '' | + | |
| - | c' | + | |
| - | + | ||
| - | \frt{Russe: | + | |
| - | + | ||
| - | Ici suit le texte en Unicode (russe) ... | + | |
| - | + | ||
| - | \rut{ texte en russe } | + | |
| - | + | ||
| - | + | ||
| - | \frt{Grec (en Polytonic)}: | + | |
| - | + | ||
| - | Ici suit le texte en grec: | + | |
| - | + | ||
| - | \grt{ texte en grec } | + | |
| - | + | ||
| - | \end{document} | + | |
| - | + | ||
| - | </ | + | |
| - | + | ||
| - | } | + | |
| - | + | ||
| - | + | ||
| - | \end{itemize} | + | |
| - | + | ||
| - | + | ||
| - | + | ||
| - | ===== Pouvez-vous donner plus de détails sur les méthodes de saisie? ===== | + | |
| - | + | ||
| - | + | ||
| - | $\Reponse$ | + | |
| - | utilisés par la langue sont très supérieurs au nombre de touche d'un clavier. | + | |
| - | Ces méthodes de saisie | + | |
| - | idéogrammes. | + | |
| - | + | ||
| - | Le principe de saisie est le suivant: une fois l' | + | |
| - | << | + | |
| - | mais faire apparaître une fenêtre (menu) qui va proposer différents choix en | + | |
| - | fonction de ce qui a déjà été tapé. Il existe de nombreuses méthodes de saisie | + | |
| - | qui sont fondées soit sur la phonétique, | + | |
| - | combinaison des deux, soit le codage direct des caractères. | + | |
| - | + | ||
| - | Une bonne méthode de saisie doit se contenter d'un nombre réduit de touches, | + | |
| - | comme 26 touches par exemple. (disponibles sur des claviers occidentaux) | + | |
| - | + | ||
| - | Voyons les méthodes de saisie suivant les langues: | + | |
| - | + | ||
| - | + | ||
| - | ==== Quelles sont les méthodes de saisie du chinois? ==== | + | |
| - | + | ||
| - | + | ||
| - | $\Reponse$ | + | |
| - | \url{http:// | + | |
| - | traduites car je ne suis en aucun cas un spécialiste des langues orientales. | + | |
| - | + | ||
| - | \begin{itemize} | + | |
| - | \item{Méthodes fondées sur la phonétique: | + | |
| - | \begin{itemize} | + | |
| - | \item{pinyin: | + | |
| - | Unies. elle utilise les caractères trouvés sur les | + | |
| - | claviers occidentaux en association avec le << | + | |
| - | Le << | + | |
| - | est assez verbeuse: zhong + guo or zhong1 + guo2 pour | + | |
| - | 2 glyphes originaux. | + | |
| - | | + | |
| - | possible de préciser le ton avec un chiffre à la fin | + | |
| - | du son comme écrit ci-dessus. Sur la page citée juste | + | |
| - | au-dessus, vous pourrez trouver plus de détails sur | + | |
| - | le positionnement des << | + | |
| - | \item{shuangpin: | + | |
| - | avec une réduction sensible du nombre de touches à | + | |
| - | taper. En général, une ou deux touches suffisent.} | + | |
| - | \item{jianpin: | + | |
| - | les deux précédentes. Voici un tableau de comparaison | + | |
| - | entre les 3 méthodes pour les mêmes glyphes: | + | |
| - | + | ||
| - | \begin{tabular}{|c|c|c|c|} | + | |
| - | | + | |
| - | Hanzi & Pinyin & ShuangPin & JianPin \\ | + | |
| - | \hline | + | |
| - | glyphe & a & a & a \\ | + | |
| - | glyphe & ku & ku & ku \\ | + | |
| - | glyphe & chu & uu & iu \\ | + | |
| - | glyphe & cuan & cc & cuj \\ | + | |
| - | glyphe & zhang & ag & ah \\ | + | |
| - | glyphe & shuang & ih & uuh \\ | + | |
| - | \hline | + | |
| - | \end{tabular} | + | |
| - | + | ||
| - | } | + | |
| - | \item{bopomofo: | + | |
| - | et modifiée de nombreuses fois ensuite. Elle est | + | |
| - | toujours d' | + | |
| - | officielle d' | + | |
| - | sur des formes calligraphiques dont certaines sont | + | |
| - | dérivées de caractères d' | + | |
| - | + | ||
| - | La méthode repose sur 37 symboles, 21 consonnes, 16 | + | |
| - | voyelles et 5 tons. | + | |
| - | Le grand désavantage de cette méthode est qu' | + | |
| - | nécessite un clavier spécifique, | + | |
| - | ne sont pas disponibles sur un clavier occidental. | + | |
| - | } | + | |
| - | \end{itemize} | + | |
| - | } | + | |
| - | \item{Méthodes fondées sur la structure:: | + | |
| - | \begin{itemize} | + | |
| - | \item{wubizixing: | + | |
| - | peut être saisi par au plus 4 appuis de touches (2 au | + | |
| - | minimum). | + | |
| - | À chaque glyphe est associé une combinaison unique | + | |
| - | d' | + | |
| - | + | ||
| - | Cette méthode divise le radical en 5 groupes, eux-même | + | |
| - | divisés en 5 groupes. Ils sont assignés aux touches | + | |
| - | de A à Y. La touche Z sert d' | + | |
| - | + | ||
| - | + | ||
| - | Voici un tableau de présentation: | + | |
| - | + | ||
| - | + | ||
| - | \begin{tabular}{|c|c|c|c|c|c|} | + | |
| - | \hline | + | |
| - | & Key 1 & Key 2 & Key 3 & Key 4 & Key 5 \\ | + | |
| - | G1 & 1 1/G & 1 2/F & 1 3/D & 1 4/S & 1 5/A \\ | + | |
| - | G2 & 2 1/H & 2 2/J & 2 3/K & 2 4/L & 2 5/M \\ | + | |
| - | G3 & 3 1/T & 3 2/R & 3 3/E & 3 4/W & 3 5/Q \\ | + | |
| - | G4 & 4 1/Y & 4 2/U & 4 3/I & 4 4/O & 4 5/P \\ | + | |
| - | G5 & 5 1/N & 5 2/B & 5 3/V & 5 4/C & 5 5/X \\ | + | |
| - | \hline | + | |
| - | \end{tabular} | + | |
| - | } | + | |
| - | + | ||
| - | \item{wubihua: | + | |
| - | (chiffre de 1 à 5 ; 6 est le caractère d' | + | |
| - | À chaque chiffre est associé une partie de base du | + | |
| - | glyphe; En fait, le dessin du glyphe est décomposé | + | |
| - | comme pour une écriture manuelle, et à chaque chiffre | + | |
| - | est associé un mouvement. La lettre T française peut | + | |
| - | être décomposée en une barre verticale et une | + | |
| - | horizontale. C'est le même principe. Il suffit d' | + | |
| - | les 5 chiffres consécutifs de la constitution du glyphe | + | |
| - | suivi du caractère d' | + | |
| - | + | ||
| - | Voir le tableau de correspondance sur le site précité. | + | |
| - | } | + | |
| - | \item{cangjie: | + | |
| - | groupes assignés aux touches suivant cette liste: | + | |
| - | + | ||
| - | + | ||
| - | La traduction est certainement approximative \ldots | + | |
| - | \begin{itemize} | + | |
| - | \item{groupe philosophique (A, B, C, D, E, F, G)} | + | |
| - | \item{groupe du trait de crayon (H, I, J, K, L, M, N)} | + | |
| - | \item{groupe des parties du corps (O, P, Q, R)} | + | |
| - | \item{groupe du contour du caractère(S, | + | |
| - | \end{itemize} | + | |
| - | } | + | |
| - | \item{sucheng: | + | |
| - | une économie de touches à taper. } | + | |
| - | \item{boshiamy: | + | |
| - | utilise les 26 touches du clavier. Elle tient compte | + | |
| - | de la forme du glyphe, de sa prononciation, | + | |
| - | signification. Chaque glyphe nécessite l' | + | |
| - | 4 touches du clavier.} | + | |
| - | \item{dayi: | + | |
| - | disponibles du clavier, ce qui est un inconvénient. | + | |
| - | Seuls 2 appuis de touches sont nécessaires pour la | + | |
| - | saisie d'un glyphe.} | + | |
| - | \item{sanjiao: | + | |
| - | dérivée de la méthode des 4 coins, utilisée | + | |
| - | pour la recherche de glyphes dans un dictionnaire.} | + | |
| - | \end{itemize} | + | |
| - | } | + | |
| - | \item{Méthodes fondées sur une combinaison phonétique--structure: | + | |
| - | Pas de détails trouvés. | + | |
| - | \begin{itemize} | + | |
| - | \item{tze-loi: | + | |
| - | \item{renzhi: | + | |
| - | \end{itemize} | + | |
| - | } | + | |
| - | + | ||
| - | \item{Méthodes de saisie directe: | + | |
| - | Pas de détails trouvés. | + | |
| - | \begin{itemize} | + | |
| - | \item{dianbaoma: | + | |
| - | \item{guojiquweima: | + | |
| - | \item{neima: | + | |
| - | \end{itemize} | + | |
| - | } | + | |
| - | + | ||
| - | \end{itemize} | + | |
| - | + | ||
| - | + | ||
| - | + | ||
| - | ==== Quelles sont les méthodes de saisie du japonais? ==== | + | |
| - | + | ||
| - | + | ||
| - | + | ||
| - | $\Reponse$ | + | |
| - | caractères romains , et le programme qui supporte la méthode de saisie propose | + | |
| - | le glyphe correspondant qui existe en trois versions: hiraganas, katakanas ou | + | |
| - | kanjis. | + | |
| - | + | ||
| - | Les informations suivantes ont été trouvées sur la page suivante: | + | |
| - | http:// | + | |
| - | + | ||
| - | Le japonais utilise 3 systèmes d' | + | |
| - | + | ||
| - | * **Hiraganas**: | + | |
| - | * **Katakanas**: | + | |
| - | * **Kanjis**: système identique au chinois(idéogrammes) qui associe à chaque glyphe un mot, un sens sans aucune équivoque possible. | + | |
| - | + | ||
| - | Voir cette page qui donne quelques informations supplémentaires: | + | |
| - | http:// | + | |
| - | + | ||
| - | + | ||
| - | ==== Quelles sont les méthodes de saisie du russe? ==== | + | |
| - | + | ||
| - | + | ||
| - | $\Reponse$ | + | |
| - | celles dérivées.) | + | |
| - | + | ||
| - | C'est une méthode simple, car il y a correspondance directe entre les touches | + | |
| - | dessinées sur le clavier et le caractère correspondant. | + | |
| - | + | ||
| - | Pour le russe, j'ai aussi vu une méthode de translittération qui traduisait | + | |
| - | les suites de caractères romains en caractères cyrilliques (méthode phonétique). | + | |
| - | Un tel mode est disponible dans '' | + | |
| - | + | ||
| - | + | ||
| - | + | ||
| - | ==== Quelle est la méthode de saisie du grec? ==== | + | |
| - | + | ||
| - | + | ||
| - | $\Reponse$ | + | |
| - | à une touche. Le clavier peut ici se trouver en deux états: clavier romain | + | |
| - | (latin) et clavier grec. Une touche (combinaison de touches) permet de commuter | + | |
| - | d'un mode à l' | + | |
| - | caractères. | + | |
| - | + | ||
| - | + | ||
| - | ==== Quelles sont les méthodes de saisie du coréen? ==== | + | |
| - | + | ||
| - | $\Reponse$ | + | |
| - | + | ||
| - | * **ASCII**: pour les caractères anglais. | + | |
| - | * **Hangul**: les glyphes sont constitués d'une consonne suivie d'une voyelle avec une finale consonnique optionnelle. Il y a une vérification de la conformité du glyphe (son en cas d' | + | |
| - | * **Hanja**: les glyphes Hanja ne peuvent être obtenus qu'à partir des glyphes Hangul. Il y a deux modes de conversion: simple et multiple. En cas de choix multiples, une liste est proposée. | + | |
| - | + | ||
| - | + | ||
| - | ==== Quelles sont les méthodes de saisie du vietnamien? ==== | + | |
| - | + | ||
| - | + | ||
| - | $\Reponse$ | + | |
| - | mais modifiée pour supporter les particularités de la langue. elle vérifie | + | |
| - | la conformité des caractères saisis. Il y a des << | + | |
| - | certaines voyelles. | + | |
| - | ( a, e, i, o, u, y, a-circumflex, | + | |
| - | or u-horn) | + | |
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | ||
| - | + | ||
| - | ===== Pouvez-vous donner plus de détails sur Unicode? ===== | + | |
| - | + | ||
| - | + | ||
| - | $\Reponse$ | + | |
| - | * http:// | + | |
| - | * http:// | + | |
| - | + | ||
| - | Il y a aussi des listes de diffusion consacrées à Unicode. Voir votre | + | |
| - | lecteur de << | + | |
| - | + | ||
| - | + | ||
| - | + | ||
| - | ==== Comment configurer la saisie des idéogrammes orientaux sur Windows? ==== | + | |
| - | + | ||
| - | + | ||
| - | $\Reponse$ | + | |
| - | l'URL suivante: http:// | + | |
| - | (en anglais). | + | |
| - | + | ||
| - | + | ||
| - | + | ||
| - | ==== Comment configurer la saisie des idéogrammes orientaux sur Mac? ==== | + | |
| - | + | ||
| - | + | ||
| - | $\Reponse$ | + | |
| - | l'URL suivante: \url{http:// | + | |
| - | + | ||
| - | + | ||
| - | ==== Comment configurer la saisie des idéogrammes orientaux sur Linux/Unix} ==== | + | |
| - | + | ||
| - | $\Reponse$ | + | |
| - | de configuration et d' | + | |
| - | disponibles sous forme de paquetages sur toutes les distributions. | + | |
| - | + | ||
| - | * http:// | + | |
| - | * http:// | + | |
| - | * Voir le «debian chinese HOWTO» sur le site http:// | + | |
| - | + | ||
| - | + | ||
| - | ===== Quels sont les problèmes de codage des textes? ===== | + | |
| - | + | ||
| - | $\Reponse$ | + | |
| - | avec < | + | |
| - | texte sera accepté par < | + | |
| - | Vous avez plusieurs possibilités suivant l' | + | |
| - | + | ||
| - | \begin{itemize} | + | |
| - | \item{Vous avez utilisé un éditeur utf-8: là, vous avez le | + | |
| - | choix d' | + | |
| - | faut savoir que toutes les langues ne sont pas supportées | + | |
| - | par ce programme. Une facilité est apportée par le paquetage | + | |
| - | optionnel \emph{autofe} de '' | + | |
| - | d'une langue à l' | + | |
| - | \item{Vous avez utilisé un éditeur utf-8 mais les langues | + | |
| - | que vous utilisez ne sont pas traitées par '' | + | |
| - | ou \OMEGA. Il vous faut utiliser un convertisseur de codage | + | |
| - | comme '' | + | |
| - | d' | + | |
| - | permet de choisir le codage de sauvegarde du fichier, qui peut | + | |
| - | être différent de celui de la saisie. Voir '' | + | |
| - | exemple. Vous transcoderez votre texte par exemple en codage | + | |
| - | CJK et traiterez le texte avec '' | + | |
| - | le même pour '' | + | |
| - | \item{Vous avez saisi votre texte avec un éditeur spécialisé, | + | |
| - | non utf-8, mais dont le codage est connu. Alors, soit l' | + | |
| - | permet de spécifier le codage de sauvegarde, soit il faut | + | |
| - | utiliser un convertisseur. } | + | |
| - | \item{Vous utilisez un éditeur << | + | |
| - | d' | + | |
| - | facilité d' | + | |
| - | programme... C'est inutilisable! (Qui a dit '' | + | |
| - | %j' | + | |
| - | \end{itemize} | + | |
| - | + | ||
| - | + | ||
| - | ===== Pouvez-vous donner des exemples d' | + | |
| - | + | ||
| - | + | ||
| - | ===== Pouvez-vous donner des exemples d' | + | |
| - | + | ||
| - | + | ||
| - | ===== Pouvez-vous donner des exemples d' | + | |
| + | Sur les machines Mac, il faut installer le « CLK » | ||
| + | (Chinese Language Kit (CLK)). | ||
| - | ===== Pouvez-vous donner des exemples d' | ||
| - | ===== Pouvez-vous donner des exemples d' | ||
| - | {{htmlmetatags> | + | {{htmlmetatags> |
| - | metatag-og: | + | metatag-og: |
| metatag-og: | metatag-og: | ||
| }} | }} | ||

