]> git.lyx.org Git - lyx.git/blob - lib/encodings
Update my email and status.
[lyx.git] / lib / encodings
1 # FIXME: Have a look at the encodings known by the inputenc package and add
2 # missing ones. Caution: File format change!
3
4 # Note that you can only add singlebyte encodings to this file.
5 # LyX does not support the output of multibyte encodings (e.g. utf16).
6 # It does support singlebyte encodings with variable with (e.g. utf8).
7 # These are marked with the "variable" keyword.
8 # Fixed width encodings are marked with the "fixed" keyword.
9 # The code points of TeX control characters like {, } and \ can occur in the
10 # second byte of some variable width encodings. These encodings must not be
11 # set as document encodings and are marked with the "variableunsafe" keyword.
12 # They are only needed for proper tex2lyx import.
13
14 # Syntax: Encoding <LyX name> <LaTeX name> <GUI name> <iconv name> fixed|variable|variableunsafe <package> End
15
16 # encodings used by inputenc.sty
17
18 Encoding utf8 utf8 "Unicode (utf8)" UTF-8 variable inputenc
19 End
20
21 # This one is used by many CJK packages. utf8 is supposed to be the successor,
22 # but does not have all features of utf8x yet.
23 Encoding utf8x utf8x "Unicode (ucs-extended) (utf8x)" UTF-8 variable inputenc
24 End
25
26 # This encoding is used to typeset Armenian using the armTeX package
27 Encoding armscii8 armscii8 "Armenian (ArmSCII8)" ARMSCII-8 fixed inputenc
28 End
29
30 Encoding iso8859-1 latin1 "Western European (ISO 8859-1)" ISO-8859-1 fixed inputenc
31 End
32
33 Encoding iso8859-2 latin2 "Central European (ISO 8859-2)" ISO-8859-2 fixed inputenc
34 End
35
36 Encoding iso8859-3 latin3 "South European (ISO 8859-3)" ISO-8859-3 fixed inputenc
37 End
38
39 Encoding iso8859-4 latin4 "Baltic (ISO 8859-4)" ISO-8859-4 fixed inputenc
40 End
41
42 Encoding iso8859-5 iso88595 "Cyrillic (ISO 8859-5)" ISO-8859-5 fixed inputenc
43 End
44
45 # Not standard, see http://tug.ctan.org/tex-archive/language/arabic/arabi/arabi/texmf/latex/arabi/
46 Encoding iso8859-6 8859-6 "Arabic (ISO 8859-6)" ISO-8859-6 fixed inputenc
47 End
48
49 Encoding iso8859-7 iso-8859-7 "Greek (ISO 8859-7)" ISO-8859-7 fixed inputenc
50 End
51
52 Encoding iso8859-8 8859-8 "Hebrew (ISO 8859-8)" ISO-8859-8 fixed inputenc
53 End
54
55 Encoding iso8859-9 latin5 "Turkish (ISO 8859-9)" ISO-8859-9 fixed inputenc
56 End
57
58 # Not standard, see http://www.vtex.lt/tex/littex/index.html
59 Encoding iso8859-13 l7xenc "Baltic (ISO 8859-13)" ISO-8859-13 fixed inputenc
60 End
61
62 Encoding iso8859-15 latin9 "Western European (ISO 8859-15)" ISO-8859-15 fixed inputenc
63 End
64
65 Encoding iso8859-16 latin10 "South-Eastern European (ISO 8859-16)" ISO-8859-16 fixed inputenc
66 End
67
68 Encoding applemac applemac "Western European (Macintosh Roman)" Macintosh fixed inputenc
69 End
70
71 Encoding cp437 cp437 "DOS (CP 437)" CP437 fixed inputenc
72 End
73
74 # cp437, but on position 225 is sz instead of beta
75 Encoding cp437de cp437de "DOS-de (CP 437-de)" CP437 fixed inputenc
76 End
77
78 Encoding cp850 cp850 "Western European (CP 850)" CP850 fixed inputenc
79 End
80
81 Encoding cp852 cp852 "Central European (CP 852)" CP852 fixed inputenc
82 End
83
84 Encoding cp855 cp855 "Cyrillic (CP 855)" CP855 fixed inputenc
85 End
86
87 Encoding cp858 cp858 "Western European (CP 858)" CP858 fixed inputenc
88 End
89
90 Encoding cp862 cp862 "Hebrew (CP 862)" CP862 fixed inputenc
91 End
92
93 Encoding cp865 cp865 "Nordic languages (CP 865)" CP865 fixed inputenc
94 End
95
96 Encoding cp866 cp866 "Cyrillic (CP 866)" CP866 fixed inputenc
97 End
98
99 Encoding cp1250 cp1250 "Central European (CP 1250)" CP1250 fixed inputenc
100 End
101
102 Encoding cp1251 cp1251 "Cyrillic (CP 1251)" CP1251 fixed inputenc
103 End
104
105 # "ansinew" is harcoded as a synonym of this (see Encodings::fromLaTeXName)
106 Encoding cp1252 cp1252 "Western European (CP 1252)" CP1252 fixed inputenc
107 End
108
109 Encoding cp1255 cp1255 "Hebrew (CP 1255)" CP1255 fixed inputenc
110 End
111
112 # Not standard, see http://tug.ctan.org/tex-archive/language/arabic/arabi/arabi/texmf/latex/arabi/
113 Encoding cp1256 cp1256 "Arabic (CP 1256)" CP1256 fixed inputenc
114 End
115
116 Encoding cp1257 cp1257 "Baltic (CP 1257)" CP1257 fixed inputenc
117 End
118
119 Encoding koi8 koi8-r "Cyrillic (KOI8-R)" KOI8-R fixed inputenc
120 End
121
122 Encoding koi8-u koi8-u "Cyrillic (KOI8-U)" KOI8-U fixed inputenc
123 End
124
125 Encoding pt154 pt154 "Cyrillic (pt 154)" PT154 fixed inputenc
126 End
127
128 Encoding pt254 pt254 "Cyrillic (pt 254)" PT254 fixed inputenc
129 End
130
131 # encodings used by CJK.sty
132
133 # The following encodings that are supported by the CJK package are not
134 # included here, because they are not widely used and lack proper iconv support:
135 # Bg5+, GBt
136 # See the NOTES file of libiconv for details.
137
138 # For traditional chinese
139 Encoding big5 Bg5 "Chinese (traditional) (Big5)" BIG5 variableunsafe CJK
140 End
141
142 # For japanese
143 # We use CP932 and not SJIS, since it is a super set of SJIS except that it
144 # translates SJIS 0x5c to U+005C (REVERSE SOLIDUS aka backslash) instead of
145 # U+00A5 (YEN SIGN). Strictly speaking this is wrong, but there is a long
146 # standing confusion which translation is correct, and using CP932 is also
147 # consistent with the SJIS example file <texmf>/doc/latex/cjk/examples/SJIS.tex
148 # of the CJK package. The CP932 extensions over SJIS do not matter here.
149 Encoding shift-jis SJIS "Japanese (CJK) (SJIS)" CP932 variableunsafe CJK
150 End
151
152 # The following encodings need hardcoded support of the encodable unicode
153 # range, but are known by iconv:
154
155 # For simplified chinese
156 Encoding euc-cn GB "Chinese (simplified) (EUC-CN)" EUC-CN variable CJK
157 End
158
159 # For simplified chinese
160 Encoding gbk GBK "Chinese (simplified) (GBK)" GBK variable CJK
161 End
162
163 # For japanese
164 Encoding jis JIS "Japanese (CJK) (JIS)" ISO-2022-JP variable CJK
165 End
166
167 # For korean
168 Encoding euc-kr KS "Korean (EUC-KR)" EUC-KR variable CJK
169 End
170
171 # The CJK package has yet another name for utf8...
172 Encoding utf8-cjk UTF8 "Unicode (CJK) (utf8)" UTF-8 variable CJK
173 End
174
175 # For traditional chinese
176 Encoding euc-tw EUC-TW "Chinese (traditional) (EUC-TW)" EUC-TW variable CJK
177 End
178
179 # For japanese
180 Encoding euc-jp EUC-JP "Japanese (CJK) (EUC-JP)" EUC-JP variable CJK
181 End
182
183 # encodings that do not use a package
184
185 # Traditional Japanese TeX programs require the japanese package.
186 # that is incompatible with CJK and inputenc.
187 Encoding euc-jp-plain euc "Japanese (non-CJK) (EUC-JP)" EUC-JP variable japanese
188 End
189 Encoding jis-plain jis "Japanese (non-CJK) (JIS)" ISO-2022-JP variable japanese
190 End
191 # FIXME: Should use variableunsafe (would be a file format change)
192 Encoding shift-jis-plain sjis "Japanese (non-CJK) (SJIS)" CP932 variable japanese
193 End
194 Encoding utf8 utf8 "Japanese (non-CJK) (utf8)" UTF-8 variable japanese
195 End
196
197 # This one needs hardcoded support, since the inputenc package does not know
198 # tis620-0, and thailatex sets up babel directly to use tis620-0, so the
199 # LaTeX name is never output to .tex files (but needed for the hardcoded
200 # tis620-0 support).
201 Encoding tis620-0 tis620-0 "Thai (TIS 620-0)" TIS620-0 fixed none
202 End
203
204 # A plain utf8 encoding that does not use the inputenc package.
205 # Such an encoding is required for XeTeX.
206 Encoding utf8-plain utf8-plain "Unicode (XeTeX) (utf8)" UTF-8 variable none
207 End
208
209 # Pure 7bit ASCII encoding (partially hardcoded in LyX)
210 Encoding ascii ascii "ASCII" ascii fixed none
211 End
212