Différences
Ci-dessous, les différences entre deux révisions de la page.
| Les deux révisions précédentesRévision précédente | |||
| 2_composition:langues:multilinguisme:codage [2021/02/10 18:58] – Suppression de ce qui ne concerne pas le codage. jejust | 3_composition:langues:multilinguisme:codage [2021/11/21 18:21] (Version actuelle) – Remise en forme de la page. Suppression des restes de code LaTeX. jejust | ||
|---|---|---|---|
| Ligne 9: | Ligne 9: | ||
| Ce codage ne permet pas de représenter les caractères accentués utilisés | Ce codage ne permet pas de représenter les caractères accentués utilisés | ||
| dans la langue française. | dans la langue française. | ||
| - | On a donc étendu le codage à 256 (sur 8 bits), et assigné les caractères | + | On a donc étendu le codage à(nbsp)256 (sur 8(nbsp)bits), et assigné les caractères |
| régionaux aux nombres de 128 à 256. | régionaux aux nombres de 128 à 256. | ||
| Ligne 21: | Ligne 21: | ||
| Pour les langues asiatiques qui n' | Pour les langues asiatiques qui n' | ||
| - | idéogrammes, | + | idéogrammes, |
| - | (glyphes) peuvent être codés. Ils ont donc codé leurs glyphes sur 2 octets, ce | + | (glyphes) peuvent être codés. Ils ont donc codé leurs glyphes sur 2(nbsp)octets, ce |
| - | qui permet de disposer de 65000 glyphes différents. Plusieurs codages | + | qui permet de disposer de 65000(nbsp)glyphes différents. Plusieurs codages |
| différents ont été utilisés pour la même langue, et sont utilisés | différents ont été utilisés pour la même langue, et sont utilisés | ||
| concurremment (suivant les machines, les régions, les habitudes, les programmes | concurremment (suivant les machines, les régions, les habitudes, les programmes | ||
| Ligne 29: | Ligne 29: | ||
| quand des programmes utilisent un codage propriétaire et ne sont plus maintenus. | quand des programmes utilisent un codage propriétaire et ne sont plus maintenus. | ||
| (voir déjà | (voir déjà | ||
| - | (version 2 de '' | + | (version(nbsp)2 de '' |
| les textes sur les nouveaux Macs avec la nouvelle version de '' | les textes sur les nouveaux Macs avec la nouvelle version de '' | ||
| - | Le codage sur 8 bits ne permet que l' | + | Le codage sur 8(nbsp)bits ne permet que l' |
| dans les cas de langues extrêmement proches comme l' | dans les cas de langues extrêmement proches comme l' | ||
| Il est possible de coder les caractères et accents particuliers de ces deux | Il est possible de coder les caractères et accents particuliers de ces deux | ||
| - | langues | + | langues sur les 128(nbsp)nombres supplémentaires. |
| Pour pouvoir utiliser plusieurs langues très différentes simultanément, | Pour pouvoir utiliser plusieurs langues très différentes simultanément, | ||
| - | utiliser l' | + | utiliser l' |
| - | toutes les langues. Le codage se fait sur plusieurs octets, et avec des codages | + | Le codage se fait sur plusieurs octets, et avec des codages différents (utf-8, utf-16, etc) |
| - | différents (utf-8, utf-16 etc ...) | + | |
| Voir plus loin pour les détails. | Voir plus loin pour les détails. | ||
| - | Les programmes de saisie de textes | + | Les programmes de saisie de textes |
| le passage d'une langue à l' | le passage d'une langue à l' | ||
| - | Ils utilisent pour cela soit le 8ème bit du nombre pour savoir si le caractère | + | Ils utilisent pour cela soit le 8< |
| est régional ou pas, ou utilisent un système de balises comme le fait < | est régional ou pas, ou utilisent un système de balises comme le fait < | ||
| - | Encore faut-il que ce balisage, codage soit documenté pour la pérennité des | + | Encore faut-il que ce balisage, codage soit documenté pour la pérennité des documents saisis. |
| - | documents saisis. | + | |
| Les éditeurs utf-8 utilisent le codage utf-8 pour représenter les glyphes, | Les éditeurs utf-8 utilisent le codage utf-8 pour représenter les glyphes, | ||
| Ligne 58: | Ligne 56: | ||
| ===== Qu' | ===== Qu' | ||
| - | |||
| $\Reponse$ | $\Reponse$ | ||
| Ligne 64: | Ligne 61: | ||
| qu' | qu' | ||
| - | Il y a donc une correspondance (bijection ...) entre le codage d'un caractère | + | Il y a donc une correspondance (bijection...) entre le codage d'un caractère |
| de texte, et son codage dans la fonte. | de texte, et son codage dans la fonte. | ||
| Ligne 73: | Ligne 70: | ||
| Nous verrons plus loin comment expliquer à < | Nous verrons plus loin comment expliquer à < | ||
| pour le texte, et quel codage est utilisé pour la fonte. | pour le texte, et quel codage est utilisé pour la fonte. | ||
| - | |||
| - | |||
| Ligne 83: | Ligne 78: | ||
| Suivant le codage utilisé pour la saisie, il sera peut-être nécessaire de | Suivant le codage utilisé pour la saisie, il sera peut-être nécessaire de | ||
| procéder à un transcodage du texte. Par exemple, '' | procéder à un transcodage du texte. Par exemple, '' | ||
| - | codage propriétaire (mais documenté ! c'est un logiciel GNU). | + | codage propriétaire (mais documenté! c'est un [[wpfr> |
| Il faudra configurer le codage de sauvegarde du texte pour qu'il soit | Il faudra configurer le codage de sauvegarde du texte pour qu'il soit | ||
| - | utilisable par < | + | utilisable par < |
| - | '' | + | par [[1_generalites: |
| + | '' | ||
| - | Le paquetage [[ctanpkg> | + | Le paquetage [[ctanpkg> |
| - | l' | + | l' |
| préciser le codage de la police utilisée. Ce paquetage permet de traiter de | préciser le codage de la police utilisée. Ce paquetage permet de traiter de | ||
| - | nombreux langages. Se reporter à la documentation de [[ctanpkg> | + | nombreux langages. Se reporter à la documentation de [[ctanpkg> |
| langues disponibles. | langues disponibles. | ||
| - | Voici quelques exemples d' | + | Voici quelques exemples d' |
| + | |||
| + | ==== Un exemple avec “babel” ==== | ||
| + | |||
| + | Le texte a été saisi avec '' | ||
| - | \begin{itemize} | ||
| - | \item{ Un exemple de [[ctanpkg> | ||
| - | Le texte a été saisi avec '' | ||
| - | par défaut (FR), et le codage est donc ISO-8859-1. | ||
| - | |||
| - | |||
| <code latex> | <code latex> | ||
| - | \documentclass{article} | + | \documentclass{article} |
| + | \usepackage[T1]{fontenc} | ||
| + | \usepackage[latin1]{inputenc} | ||
| + | \usepackage[frenchb]{babel} | ||
| + | % Commentaire : fin du preambule | ||
| - | \usepackage[T1]{fontenc} | + | \begin{document} |
| - | \usepackage[latin1]{inputenc} | + | |
| - | \usepackage[frenchb]{babel} | + | |
| - | % Commentaire : fin du preambule | + | \title{Titre de mon article} |
| + | \author{Le Monsieur \and La Madame} | ||
| + | \date{Le \today} | ||
| - | \begin{document} | + | |
| - | \title{Titre de mon article} | + | \begin{abstract} |
| - | \author{Le Monsieur \and La Madame} | + | Résumé |
| - | \date{Le \today} | + | \end{abstract} |
| - | \maketitle | + | |
| - | \begin{abstract} | + | \tableofcontents |
| - | Résumé de mon article, passionnant. | + | |
| - | \end{abstract} | + | |
| - | \tableofcontents | + | \section{Explications} |
| - | \section{Explications} | + | \texttt{fontenc}, \texttt{inputenc} |
| + | sont des packages permettant d' | ||
| + | les accents. | ||
| + | \texttt{babel} sert à franciser le | ||
| + | document. | ||
| - | \texttt{fontenc}, | + | \end{document} |
| - | sont des packages permettant d' | + | </ |
| - | les accents. | + | |
| - | \texttt{babel} sert à franciser le | + | ==== Un exemple avec “CJK-LaTeX” ==== |
| - | document. | + | |
| - | + | ||
| - | \end{document} | + | |
| - | </ | + | |
| - | } | + | Cet exemple a été saisi avec '' |
| - | \item Un exemple de '' | + | version |
| - | Cet exemple a été saisi avec '' | + | langues. Le codage interne est spécifique à '' |
| - | version | + | il est possible de spécifier avec quel codage on veut que |
| - | langues. Le codage interne est spécifique à '' | + | soit écrit le fichier sur le disque. |
| - | il est possible de spécifier avec quel codage on veut que | + | Le texte '' |
| - | soit écrit le fichier sur le disque. | + | comprends pas le chinois) et j'en ai seulement traduit la partie |
| - | Le texte <<chinese.tex>> | + | en anglais. |
| - | comprends pas le chinois) et j'en ai seulement traduit la partie | + | |
| - | en anglais. | + | |
| - | Le texte a été traité par '' | + | |
| - | Il est difficile de montrer des exemples réels car cette FAQ | + | Le texte a été traité par '' |
| - | est en langage national, et ne gère pas l' | + | |
| - | \ldots | + | Il est difficile de montrer des exemples réels car cette FAQ |
| - | Une solution serait d' | + | est en langage national, et ne gère pas l' |
| - | travail), mais la taille de cette FAQ augmenterait d'une façon | + | Une solution serait d' |
| - | déraisonnable. | + | travail), mais la taille de cette FAQ augmenterait d'une façon |
| - | + | déraisonnable. | |
| - | Notez la première ligne du texte qui indique à '' | + | |
| - | nature de le codage du texte. | + | |
| + | Notez la première ligne du texte qui indique à '' | ||
| + | nature de le codage du texte. | ||
| <code latex> | <code latex> | ||
| - | |||
| %% -*- coding: emacs-mule -*- | %% -*- coding: emacs-mule -*- | ||
| \documentclass[12pt]{article} | \documentclass[12pt]{article} | ||
| - | \usepackage{times} | + | |
| - | \renewcommand{\baselinestretch}{1.2} | + | \renewcommand{\baselinestretch}{1.2} |
| \begin{document} | \begin{document} | ||
| Ligne 182: | Ligne 173: | ||
| sur la partie gauche en chinois traditionnel, | sur la partie gauche en chinois traditionnel, | ||
| à droite en chinois simplifié. | à droite en chinois simplifié. | ||
| - | '' | + | \texttt{CJK-LaTeX} s' |
| - | '' | + | \texttt{Emacs-mule} de telle façon qu'il |
| est possible de saisir et d' | est possible de saisir et d' | ||
| types de fontes (Big5 pour les caractères | types de fontes (Big5 pour les caractères | ||
| Ligne 194: | Ligne 185: | ||
| Le fichier a été exporté en utilisant la fonction | Le fichier a été exporté en utilisant la fonction | ||
| \verb|cjk-write-file| fournie par le paquetage | \verb|cjk-write-file| fournie par le paquetage | ||
| - | '' | + | \texttt{CJK-LaTeX}, et le résultat a été passé à |
| - | '' | + | \texttt{PDF-LaTeX}. |
| - | Ici, signature en chinois \ldots | + | Ici, signature en chinois\ldots |
| \end{document} | \end{document} | ||
| Ligne 203: | Ligne 194: | ||
| - | \item{Un exemple | + | ==== Un exemple |
| - | Vous pourrez trouver des exemples dans la distribution de | + | |
| - | '' | + | |
| - | \url{http:// | + | |
| - | } | + | |
| - | \item{Un exemple de '' | + | |
| - | Vous pourrez trouver des exemples dans la distribution | + | |
| - | '' | + | |
| - | \url{http:// | + | |
| - | Linux adorée \ldots | + | |
| - | Debian propose un paquetage << | + | |
| - | dans la section documentation. | + | |
| - | } | + | |
| - | \item{Un exemple | + | Vous pourrez trouver des exemples dans la distribution |
| - | Le texte a été saisi avec '' | + | '' |
| - | + | ||
| - | + | ||
| - | <code latex> | + | |
| - | \documentclass[french, | + | |
| - | \usepackage[notipa]{ucs} | + | ==== Un exemple avec “THAI-LaTeX” ==== |
| - | \usepackage[utf8]{inputenc} | + | |
| - | \usepackage[T1]{fontenc} | + | |
| - | \usepackage[T3, | + | |
| - | \usepackage[greek, | + | |
| + | Vous pourrez trouver des exemples dans la distribution | ||
| + | '' | ||
| + | ou dans votre distribution Linux adorée... | ||
| + | Debian propose un paquetage '' | ||
| + | dans la section documentation. | ||
| - | \title{Un titre} | + | ==== Un exemple avec “UCS-LaTeX” ==== |
| - | \author{Auteur} | + | Le texte a été saisi avec '' |
| + | |||
| + | |||
| + | <code latex> | ||
| + | \documentclass[french, | ||
| - | % commande | + | |
| - | \newcommand\frt[1]{\foreignlanguage{french}{#1}} | + | \usepackage[utf8]{inputenc} |
| + | | ||
| + | \usepackage[T3, | ||
| + | \usepackage[greek, | ||
| - | % commande \rut pour écrire en russe | ||
| - | \newcommand\rut[1]{\foreignlanguage{russian}{# | ||
| - | % commande grt pour écrire du texte en grec | + | \title{Un titre} |
| - | \newcommand\grt[1]{\foreignlanguage{greek}{#1}} | + | \author{Auteur} |
| - | % commande \phot pour écrire du texte en alphabet | + | % commande \frt pour écrire du texte français |
| - | %phonétique | + | \newcommand\frt[1]{\foreignlanguage{french}{#1}} |
| - | \newcommand\phot[1]{\bgroup\fontencoding{T3}% | + | |
| - | \selectfont\SetUnicodeOption{tipa}#1\egroup} | + | |
| + | % commande \rut pour écrire en russe | ||
| + | \newcommand\rut[1]{\foreignlanguage{russian}{# | ||
| - | \begin{document} | + | % commande grt pour écrire du texte en grec |
| + | \newcommand\grt[1]{\foreignlanguage{greek}{#1}} | ||
| - | \maketitle | + | % commande |
| + | % phonétique | ||
| + | \newcommand\phot[1]{\bgroup\fontencoding{T3}% | ||
| + | \selectfont\SetUnicodeOption{tipa}# | ||
| - | \tableofcontents | + | \begin{document} |
| - | \section{Je suis auteur de textes multilingues et | + | \maketitle |
| - | de dictionnaires: | + | |
| - | La composition de textes multilingues dans le cadre | + | \tableofcontents |
| - | d' | + | |
| - | par | + | |
| - | c' | + | |
| - | \frt{Russe:} | + | \section{Je suis auteur de textes multilingues et |
| + | de dictionnaires: comment faire ?} | ||
| - | Ici suit le texte en Unicode (russe) ... | + | La composition de textes multilingues dans le cadre |
| + | d'un traitement | ||
| + | par \LaTeX{} doit se faire en '' | ||
| + | c'est le seul moyen pour\dots | ||
| - | \rut{ texte en russe } | + | \frt{Russe:} |
| + | Ici suit le texte en Unicode (russe)\dots | ||
| - | \frt{Grec (en Polytonic)}: | + | \rut{ texte en russe } |
| - | Ici suit le texte en grec: | ||
| - | \grt{ texte en grec } | + | \frt{Grec polytonique)}: |
| - | \end{document} | + | Ici suit le texte en grec: |
| - | </ | + | \grt{ texte en grec } |
| - | + | ||
| - | } | + | |
| - | + | ||
| - | + | ||
| - | \end{itemize} | + | |
| + | \end{document} | ||
| + | </ | ||

