Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
2_composition:langues:latex_et_l_utf8 [2021/02/10 18:24] – Correction des liens internes. Mots-clefs OpenGraph. jejust3_composition:langues:latex_et_l_utf8 [2021/06/20 20:15] (Version actuelle) – Correction de coquille. jejust
Ligne 1: Ligne 1:
-====== Unicode and TeX ======+====== Est-ce que TeX est compatible avec Unicode? ======
  
-Unicode is a character code scheme that has the capacity to express 
-the text of the languages of the world, as well as important symbols 
-(including mathematics).  Any coding scheme that is directly 
-applicable to TeX may be expressed in single bytes (expressing up 
-to 256 characters); Unicode characters may require several bytes, and 
-the scheme may express a very large number of characters. 
  
-For "old-style" applications (TeX or pdfTeX) to deal with +[[wpfr>Unicode]] est un schéma de codage des caractères qui a la capacité de représenter les textes de toutes les langues du monde, 
-Unicode input, the sequence of bytes to make up Unicode character are +ainsi que des symboles importants (y compris les symboles mathématiques).
-processed by a set of macros that deliver a glyph number in an +
-appropriate font.  The macros that read these bytes is complicated, +
-and manifests as ''utf8'' option for the LaTeX distribution +
-[[ctanpkg>inputenc]] package; the coverage of that option is limited to +
-Unicode characters that can be represented using "LaTeX standard +
-encodings"Current LaTeX releases, since 2018 default to a processing +
-equivalent to+
  
 +Nativement, TeX comprend les schémas de codage utilisant des octets simples (c'est-à-dire codant les caractères sur 8 bits((Jusqu'en 1989, TeX utilisait même un codage sur 7 bits, ne pouvant représenter que 128 caractères, soit juste l'alphabet anglais plus quelques caractères spéciaux. D'où [[3_composition:texte:symboles:caracteres:accents_divers|la syntaxe historique pour mettre des acccents sur les lettres]]: ''\'e'' pour «(nbsp)<latex>é</latex>(nbsp)», etc.)),
 +et ne pouvant donc représenter que 256 caractères au maximum). Or Unicode, pour pouvoir représenter un très grand nombre de caractères,
 +[[wpfr>UTF-8|peut nécessiter plusieurs octets par caractère]].
 +
 +
 +Pour que les applications « à l'ancienne », comme TeX ou pdfTeX, puissent comprendre un fichier en Unicode,
 +la séquence d'octets composant chaque caractère Unicode doit être traitée par une série de macros qui fournissent
 +un numéro de glyphe dans une police appropriée. Les macros qui lisent le flux d'entrée sont compliquées,
 +mais pour l'utilisateur, il suffit d'utiliser l'option ''utf8'' quand il charge l'extension [[ctanpkg>inputenc]]
 +(présente par défaut sur toute installation de LaTeX):
 <code latex> <code latex>
 \usepackage[utf8]{inputenc} \usepackage[utf8]{inputenc}
 </code> </code>
 +Depuis 2018, il n'y a même plus besoin d'inclure cette ligne dans le préambule des documents:
 +c'est l'option par défaut.
 +
 +Cette option ne sait traiter que les caractères Unicode qui peuvent être représentés avec
 +les « encodages standards de LaTeX ».
 +Le paquet séparé [[ctanpkg>ucs]] fournit une couverture plus large, mais moins robuste, via l'option ''utf8x'' de [[ctanpkg>inputenc]].
 +
 +<note important>
 +L'option ''utf8'' est très souvent suffisante.
 +
 +En règle générale, vous ne devriez jamais utiliser ''utf8x'' avant d'être convaincu que ''utf8'' ne suffit pas.
 +</note>
 +
 +Les applications « modernes », telles [[1_generalites:glossaire:qu_est_ce_que_xetex|XeTeX]]
 +et [[1_generalites:glossaire:qu_est_ce_que_luatex|LuaTeX]], lisent leur entrée en utilisant
 +par défaut des représentations UTF-8 d'Unicode. Elles utilisent également des polices TrueType ou OpenType pour leur sortie;
 +or chacune de ces polices possède des tables qui indiquent à l'application quelle(s) partie(s) de l'espace Unicode elle couvre,
 +ce qui permet au moteur de décider quelle police utiliser pour tel ou tel caractère (si besoin).
  
-The separate package [[ctanpkg>ucs|ucs]] provides wider, but +Tout ce ceci fait qu'UTF-8 est maintenant complètement supporté par LaTeX
-less robust, coverage via an [[ctanpkg>inputenc]] option +et que vous n'avez plus besoin d'avoir peur de convertir vos documents anciens.
-''utf8x'' As a general ruleyou should never use ''utf8x'' +
-until you have convinced yourself that ''utf8'' can not do +
-the job for you.+
  
-"Modern" TeX-alike applications, [[1_generalites:glossaire:xetex_et_luatex|XeTeX and LuaTeX]] 
-read their input using UTF-8 representations of Unicode as standard. 
-They also use TrueType or OpenType fonts for output; each such font 
-has tables that tell the application which part(s) of the Unicode 
-space it covers; the tables enable the engines to decide which 
-font to use for which character (assuming there is any choice at all). 
  
 ----- -----
 //Source:// [[faquk>FAQ-unicode|Unicode and TeX]] //Source:// [[faquk>FAQ-unicode|Unicode and TeX]]
  
-{{htmlmetatags>metatag-keywords=(LaTeX,concepts,luatex,unicode,xetex,UTF8,encodage) +{{htmlmetatags>metatag-keywords=(LaTeX,concepts,luatex,unicode,xetex,UTF8,UTF16,UTF-8,UTF-16,encodage) 
-metatag-og:title=(Unicode and TeX)+metatag-og:title=(Est-ce que TeX est compatible avec Unicode?)
 metatag-og:site_name=(FAQ LaTeX francophone) metatag-og:site_name=(FAQ LaTeX francophone)
 }} }}
  
3_composition/langues/latex_et_l_utf8.1612981476.txt.gz · Dernière modification : 2021/02/10 18:24 de jejust
CC Attribution-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0