4. Kódování esperantských písmen

V předchozí kapitole jsme se seznámili s esperantskou abecedou. Jelikož tento kurs předpokládá, že bude interaktivní, tzn. kdo budete chtít, můžete mi posílat vypracovaná cvičení k opravě, musíme si říci, jak se esperantská písmena kódují. Jelikož nejjednodušší způsob, jak cvičení vypracovat, je jeho ztvárnění do podoby HTML a odeslání takto vzniklého souboru emailem (sice dávám přednost nitrolaku, protože schne rychleji než email, ale k přenosu zpráv se příliš nehodí, takže raději tím emailem), musíme si vysvětlit, kde se ta esperantská písmenka s diakritickými znaménky vezmou.

Esperantská písmenka s diakritickými znaménky jsou ukryta ve většině běžně užívaných fontů (Arial, Courier New, Times New Roman, Verdana…) – ale jen v těch pro Windows 95 a vyšších – pod kódy nad 256, tzn., že musíme při jejich psaní používat buď kódování Unicode (nejlépe ve formátu »utf-8«), nebo použít kódovou stránku iso-8829-3, která obsahuje esperantská písmena přímo, nebo – pokud použijeme jiné kódové stránky (zpravidla »windows-1250«, »iso-8829-2« nebo tu, kterou vám nabízí váš operační systém), musíme písmenka kódovat jako číselnou entitu Poznámka: Existují i entity znakové, ale jsou natolik šíleně konstruované, že je tady vůbec neuvádím. Kdo o ně má zájem, tak si je stejně najde… pro zápis speciálních znaků v jazyce HTML. Přehled kódů je patrný z následující tabulky:

Kódování esperantských písmen (tabulka 1)
Znak iso-8859-3 Unicode entita Znak iso-8859-3 Unicode entita
ĉ 230 265 ĉ Ĉ 198 264 Ĉ
ĝ 248 285 ĝ Ĝ 216 284 Ĝ
ĥ 182 293 ĥ Ĥ 166 292 Ĥ
ĵ 188 309 ĵ Ĵ 172 308 Ĵ
ŝ 254 349 ŝ Ŝ 222 348 Ŝ
ŭ 253 365 ŭ Ŭ 221 364 Ŭ

Pokud byste si s kódováním nevěděli rady, uložte si tento soubor (je napsán v kódování »windows-1250«) na disk a prohlédněte si ho programem »Notepad« nebo jiným prostředkem pro tvorbu HTML stránek, pochopitelně ale ne v módu tzv. WYSIWYG; to byste z toho kódování stejně nebyli moudří.

Pokud tedy máte v hlavičce stránky deklarace:

<meta HTTP-EQUIV="Content-Type" content="text/html; charset=iso-8859-3">
<meta HTTP-EQUIV="Content-Language" content="eo">


pak můžete psát celou stránku esperantem (příklad) a použít kódování podle iso-8829-3. Případné české znaky lze zapisovat entitami podle následující tabulky:

Kódování českých a slovenských písmen (tabulka 2)
Znak windows-1250 iso-8859-2 Unicode Znak windows-1250 iso-8859-2 Unicode
č 232 232 267 Č 200 200 268
ď 239 239 271 Ď 207 207 270
ě 236 236 283 Ě 204 204 282
ĺ 229 229 314 Ĺ 197 197 313
ľ 190 181 318 Ľ 188 165 317
ň 242 242 328 Ň 210 210 327
ŕ 224 224 341 Ŕ 192 192 340
ř 248 248 345 Ř 216 216 344
š 154 185 353 Š 138 169 352
ť 157 187 357 Ť 141 171 356
ů 249 249 367 Ů 217 217 366
ý 253 253 253 Ý 221 221 221
ž 158 190 382 Ž 142 174 381

Příslušnou číselnou entitu zapíšeme tak, že kód Unicode příslušného písmene doplníme zepředu znaky »&#« a zezadu středníkem (viz tabulku 1).
Poznámka: Ostatní česká, slovenská (a i německá) písmena (á, ä, é, í, ó, ô, ö, ß, ú, ü) jsou na všechtřech kódových stránkách umístěna shodně, proto se o ně nemusíme starat.

Máte-li v hlavičce stránky deklaraci windows-1250

<meta HTTP-EQUIV="Content-Type" content="text/html; charset=windows-1250">
<meta HTTP-EQUIV="Content-Language" content="cs">


nebo iso-8859-2

<meta HTTP-EQUIV="Content-Type" content="text/html; charset=iso-8859-2">
<meta HTTP-EQUIV="Content-Language" content="cs">


píšete stránky česky a případné esperantské znaky je nutno psát entitami podle tabulky 1.

Pokud se na stránkách často střídá čeština s esperantem nebo dalšími jazyky (francouzština, ruština, řečtina…), je vhodné stránku kódovat jako

<meta HTTP-EQUIV="Content-Type" content="text/html; charset=utf-8">

Pak je ovšem nutné všechny znaky kódovat jako Unicode ve formátu »utf-8«. (Tak jsou například psány i stránky tohoto kursu.)


© , 2000 – 2016


Předchozí kapitola       Pokračování       Zpět na obsah


Poslední aktualizace: 

[CNW:Counter]