Merkistöjä
Etusivu Tietosivut Huumori Harrastukset Valokuvia Linkit
 

Merkistöjä

Sivulla listataan tavanomaisten ASCII-merkkien lisäksi vastaavat länsimaiset kirjaimet, morseaakkoset sekä näkövammaisten käyttämät braille-merkit. Sivulle saattaa tulla aikanaan myös tietoa muista merkistöistä ja niiden historiasta. Edessäsi on siis varsin sekava, mutta mahdollisesti myös hyödyllinen sivu... joka on vielä todellakin hieman työn alla...

ASCII-merkistö

ASCII-merkistö on perusta tietotekniikassa käytettäville merkistöille. Se käsittää yhteensä 128 merkkiä numeroituna välillä 0..127. Merkistöön on tehty lukuisia laajennuksia sekä muunnelmia johtuen eri kielien käyttämistä lukuisista erilaisista kirjoitusmerkeistä. Näistä laajennusten ja muunnelmien eroavaisuuksista saamma monesti nauttia saadessamme sähköpostia henkilöltä, jolla on käytössään eri merkistö kuin itsellämme.

Tietotekniikan alkuaikoina oli tarve pitää käytettyjen merkkien määrä rajallisena, joten päädyttiin 7-bittiseen eli 128 merkkiä sisältävään ASCII-merkistöön, joka ei sisällä esimerkiksi skandinaavisia merkkejä. Kaikki muistamme televisioruudusta nimet 'haemaelaeinen' ja 'toermaenen' eikä kyseisiin skandiversioihin voi olla törmäämättä vielä tänäkään päivänä.

ISO Latin 1 (ISO-8859-1)

ASCII ei tarjoa kaikkia tarvittavia merkkejä useimpien kielten esittämiseen, joten esimerkiksi skandinaavisten kielten esittämiseen tarvitaan hieman laajennettu merkistö. Tämän vuoksi kehitettiin standardikokonaisuus ISO-8859, joka perustuu lähes kaiken kattavaan 16-bittiseen (=65536 merkkiä) Unicode-merkistöön, mutta jokainen merkistö koostuu vain 256 merkistä. ISO Latin -merkistöt ovat lähestulkoon ASCII-merkistöä vastaavia, mutta sisältävät joitain kieliriippuvia laajennuksia ja poikkeuksia:

  • ISO-8859-1 (Western, West European): Länsimainen, länsieurooppalainen
  • ISO-8859-2 (Latin-2, Middle Europe): Keski-Eurooppa (mm. Tshekki, Slovaki, Unkari ja Puola)
  • ISO-8859-3 (Southern Europe): Etelä-Eurooppa, Malta, Esperanto
  • ISO-8859-4 (Latin-4, Northern Europe): Baltia (Viro, Latvia, Liettua ja Suomi)
  • ISO-8859-5 (Cyrillic): Kyrillinen (harvoin käytetty)
  • ISO-8859-6 (Arabic): Arabialainen (harvoin käytetty)
  • ISO-8859-7 (Greek): Kreikka
  • ISO-8859-8 (Hebrew and Yiddish): 
  • ISO-8859-9 (Latin-5): Turkki
  • ISO-8859-10 (Nordic):  Saami, Inuiitti, Islanti
  • ISO-8859-11 (Thai):
  • ISO-8859-12 (): Ei käytössä
  • ISO-8859-13 (Latin-7): ISO-8859-4:n uudempi versio
  • ISO-8859-14 (Celtic): 
  • ISO-8859-15 (Latin-9): Sama kuin ISO-8859-1, mutta mukana euron merkki.
  • ISO-8859-16 (Romanian and other languages): 

Windows-ympäristössä käytettävä merkistö ei perustu varsinaisesti mihinkään standardiin vaikka siitä ANSI tai ISO -liitteillä joskus puhutaankin. Windows-merkistöt ovat oma versio ISO Latin -laajennuksille ASCII-merkistöstä. Esimerkiksi tällä sivustolla käytetään Windows-1252 -merkistöä.

HTML Entiteetit

Osa erikoismerkeistä on HTML-kielessä kirjoitettava erityisellä entiteetti-merkinnällä (&xxxx;). Esimerkiksi &-merkki on korvattava merkkiyhdistelmällä &

Listan entiteeteistä löydät esimerkiksi täältä.

Morseaakkoset

Morseaakkoset ovat saaneet nimensä keksijänsä skotlantilais-amerikkalaisen taidemaalarin ja keksijän Samuel Morsen (1791 - 1872) mukaan. Morse sai idean lennättimestä vuonna 1832 matkustaessaan Atlantilla kohti Amerikkaa. 1800-luvun puolivälissä lennätin alkoi yleistyä pitkien matkojen viestivälineenä.

Järjestelmä on edelleen käytössä etenkin merellä, missä muut liikenneyhteydet eivät välttämättä toimi luotettavasti. Liikenteen nopeuttamiseksi käytettään erillisiä lyhenteitä, kuten kansainväliset Q-lyhenteet sekä lähinnä sotilaskäytössä olevat Z-lyhenteet. Q-lyhenteet löytyvät mm. Suomen Radioamatööriliiton sivuilta.

Braille

Näkövammaisille tarkoitetut braille-symbolit eli monelle tutumman pistekirjoituksen kehitti ranskalainen Louis Braille (1809 - 1852) vuonna 1825. Pistekirjoitus julkistettiin 1829 ja se hyväksyttiin viralliseen käyttöön 1844.

Merkit koostuvat kolme pistettä korkeasta ja kaksi pistettä leveästä matriisista. Merkin korkeus on noin 7 ja leveys 4 millimetriä. Pisteiden halkaisija on 1,5 millimetriä ja pisteiden keskipisteiden etäisyys 2,5 millimetriä. Kahden merkin väli etäisyys on vaakasuunnassa 3,75 mm ja pystysuunnassa 5,0 millimetriä (mitattuna reunimmaisten pisteiden keskeltä).

Numerot ja isot kirjaimet sekä esitetään kahden peräkkäisen merkin avulla. 

Käytetty merkistö vaihtelee erityisesti erikois- ja välimerkkien kohdalla jonkin verran eri kielten välillä.

Kanji merkit

Viimeistään tässä vaiheessa on syytä todeta, että tällä sivulla on varsin hupaisa syntyhistoria. Japanissa on yleisesti käytössä kaksi merkistöä, katakana ja kanji. Näistä jälkimmäiseen olen muinoin joutunut tutustumaan työni puolesta, joten sekin tällä sivulla  esitetään...


Kanji -merkistö...

Kuten ylläolevasta kuvasta helposti näkee, perustuu japanin kieli konsonantti-vokaali -tavurakenteeseen.

Merkistöt taulukossa

Taulukossa näkyvät kirjaimet riippuvat tietysti käyttämästäsi merkistöstä sekä fontista. Suomessa 128:n merkin ISO-646-SF -määrityksen mukaiset korjaukset on suluissa alemmalla rivillä. Taulukossa on ASCII-merkit 32-127, jonka jälkeen on lueteltu joitain muita perusmerkistöön kuulumattomia merkkejä, joille on vastine esim. pistekirjoituksessa.

Dec Hex ASCII  HTML Morse Braille
032 20      

033 21 !    

034 22 " "  

035 23 #    

036 24 $    

037 25 %    

038 26 & &  

039 27 ' '  

040 28 (    

041 29 )    

042 2A *    

043 2B +    

044 2C ,   _ _ . . _ _

045 2D -    

046 2E .   . _ . _ . _

047 2F /   _ . . _ .

048 30 0   _ _ _ _ _



049 31 1   . _ _ _ _



050 32 2   . . _ _ _



051 33 3   . . . _ _



052 34 4   . . . . _



053 35 5   . . . . .



054 36 6   _ . . . .



055 37 7   _ _ . . .



056 38 8   _ _ _ . .



057 39 9   _ _ _ _ .



058 3A :   _ _ _ . . .

059 3B ;    

060 3C < &lt;  

061 3D =    

062 3E > &gt;  

063 3F ?   . . _ _ . .

064 40 @    

065 41 A   . _



066 42 B   _ . . .



067 43 C   _ . _ .



068 44 D   _ . .



069 45 E   .



070 46 F   . . _ .



071 47 G   _ _ .



072 48 H   . . . .



073 49 I   . .



074 4A J   . _ _ _



075 4B K   _ . _



076 4C L   . _ . .



077 4D M   _ _



078 4E N   _ .



079 4F O   _ _ _



080 50 P   . _ _ .



081 51 Q   _ _ . _



082 52 R   . _ .



083 53 S   . . .



084 54 T   _



085 55 U   . . _



086 56 V   . . . _



087 57 W   . _ _



088 58 X   _ . . _



089 59 Y   _ . _ _



090 5A Z   _ _ . .



091 5B [
(Ä)
&Auml;
. _ . _


092 5C \
(Ö)
&Ouml;
_ _ _ .


093 5D ]
(Å)
&Aring;
. _ _ . _


 
094 5E ^
(Ü)
&Uuml;  

095 5F _    

096 60 `    

097 61 a   . _

098 62 b   _ . . .

099 63 c   _ . _ .

100 64 d   _ . .

101 65 e   .

102 66 f   . . _ .

103 67 g   _ _ .

104 68 h   . . . .

105 69 i   . .

106 6A j   . _ _ _

107 6B k   _ . _

108 6C l   . _ . .

109 6D m   _ _

110 6E n   _ .

111 6F o   _ _ _

112 70 p   . _ _ .

113 71 q   _ _ . _

114 72 r   . _ .

115 73 s   . . .

116 74 t   _

117 75 u   . . _

118 76 v   . . . _

119 77 w   . _ _

120 78 x   _ . . _

121 79 y   _ . _ _

122 7A z   _ _ . .

123 7B {
(ä)
&auml;
. _ . _


124 7C |
(ö)
&ouml;
_ _ _ .


125 7D }
(å)
&aring;
. _ _ . _


126 7E ~
(ü)
&uuml;  

127 7F ¦ &brvbar;  

    ç &ccedil;  

    é &eacute;  

    à &agrave;  

    è &egrave;  

    ù &ugrave;  

    â
(å)
&acirc;  

    ê &ecirc;  

    î &icirc;  

    ô &ocirc;  

    û &ucirc;  

    ë &euml;  

    ï &iuml;  

    ü &uuml;  

    œ
(ö)
 &oelig;  

    æ &aelig;    
           
           
           

Windows -ympäristössä halutun merkin saa ruutuun pitämällä Alt-näppäintä pohjassa, näppäilemällä desimaaliarvon ja päästämällä Alt-näppäimen. Riippuu luonnollisesti käytetystä merkistöstä, mikä merkki ruutuun ilmestyy.


Merkillisyyksiä on päivitelty 01.03.2021.