VASTAB Anto Veldre, Riigi Infosüsteemi Ameti infoturbeekspert

3 minutit

Ladina tähestikku kasutavad rahvad seevastu ajasid esialgu läbi kas ilma täpitähtedeta (sh eestlased) või tegid kooditabelis omavolilist haltuurat (nagu soomlased, kes ohverdasid  nurksulud oma täpitähtedele). Teema tuli teravalt päevakorda seoses ida keelte ja kultuuridega, kus vajalike sümbolite hulk oli palju suurem kui 32. Vanemad arvutikasutajad mäletavad olukordi, kus täpitähtede asemel näidati hoopis kirillitsat. See asjaolu osutab, et tähtede kodeerimises arvutikeelde ei ole midagi kindlat ja jäävat, küsimus on vaid kokkulepetes (standardites) ja nende järgimises. Lahendus on lihtne: tegelik aadress, mida  arvutid näevad, esitatakse sigrimigriks kodeeritult ning inimesele paistab asi ekraanil ilusam, kui see reaalsuses on. Beekmanit parafraseerides: las arvuti töötab (teisendab ja kodeerib), tema on rauast. Meetodi teaduslik nimetus on MIME – Multipurpose Internet Mail Extensions.     

Nii näiteks, kui e-post saadetakse isikule, kelle nimi on Õnne-Üllatus Jää-Äär, siis masinad näevad seda pärisnime hoopis kujul 1W5uZS3cbGxhdHVzIErk5C3k5HI=. Kurb küll, aga trikk aitab vaid nime puhul. Postiaadress ise peab endiselt olema muldvana kooditabeli piires ehk enesetsensuuri korras tuleb valida midagi selletaolist: onneullatus. jaa-aar@abcde.ee. Lisaks tuleb masinatele  öelda, millisesse kooditabelisse tulemus tõlkida, kas eesti või hoopis jaapani omasse. Lõppkokkuvõttes saame aadressireale säärase jõleduse: To: =?windows-1257?B?1W5uZS3cbGxhdHVzIErk5C3k5HI= <onne-ullatus.jaa-aar@abcde.ee>   

Šoki vähendamiseks võib koera saba raiuda ka jupikaupa: To: Niit ja =?utf-8?q?N=C3=B5el?= Interneti domeenidega on asi peaaegu et veelgi lihtsam. Eesti Interneti Sihtasutus juba reserveerib täpitähtedega domeeninimesid ja  13. juunist saab neid päris vabalt tellida. Siiski on ka siin mõned piirangud. Täpitähena defineeritakse vaid 6 objekti ehk õ, ä, ö, ü, š ja ž, kuid näiteks Čapek.ee domeeni registreerida ei saa. Jaapanis ja Hiinas seevastu on tugi olemas ka hieroglüüfdomeenidele. Standardi teaduslik nimetus on IDN – International Domain Names. 

Kodeerimispõhimõte on küllaltki sarnane e-postiga. Masinatele näidatakse mingit sigrimigrit. 

Eeldusel, et keegi registreerib domeeni õnneüllatus.ee, siis masinad näevad seda kujul: xn- -nnellatus-p7a4f.ee. Ütleme ausalt, mõni sirvik muudab selle mudru kasutajale suupäraseks, mõni mitte. Isegi säärane suur riik nagu Venemaa realiseeris oma rahvusliku tähestiku domeeninimedes alles eelmisel aastal. Näiteks kui keegi riskib külastada säärast linki nagu http://xn– d1abbgf6aiiy.xn- – p1ai/, siis tegelikult satub ta  hoopis karuonu kodulehele (президент.рф). Täpitähtede olukord veebilingi sabaosas on kõige nutusem ja perspektiivitum, kuigi uus standard IRI (Internationalized Resource Identifiers) üritab seda ääri-veeri parandada. Kui keegi tahab oma veebiserveris serveerida faili õ.html, siis ise teab, millega riskib. Ei saa välistada, et mingis teises kultuuris võib masin kliendile selle koha peal näidata hoopis mingit muud roppu tähte. 

Jaga

Samal teemal

Jaga
Sirp