Der ASCII-Code - The American Standard Code of Information Interchange history menue Letztmalig dran rumgefummelt: 05.05.19 03:29:09

Die Geschichte des ASCII-Codes ist deshalb so fundamental, weil durch diesen die Größe unserer sinnvoll kleinen Informationspakete auf 8 geschraubt wurde und in absehbarer Zeit diese auch weiterhin verwendet werden bzw. bei Bedarf durch mehrmaliges Einlesen sowie Aneinanderreihen Vielfache des Bytes zum Tragen kommen. Ursprünglich war der ASCII-Code allerdings ein 7-Bit-Code, was man an diversen Stellen (E-Mail-Systeme) auch heute noch bemerken kann.

01001101 01010101 01010100 01010100 01001001 01001001 01000011 01001000 01001000 01000001 01000010 01000101 01000100 01000101 01001110 01010011 01000101 01001110 01000110 01010110 01000101 01010010 01000111 01000101 01010011 01010011 01000101 01001110

... das heißt: Mutti, ich habe den Senf vergessen!!!

1. Zur Geschichte
2. Der ASCII-Code
3. ASCII-Code in der heute praktischen Anwendung
4. Marias Hinrichtung
5. Links & verwandte Themen

Codes

Logo des ASCII-Codes

Basiswissen der Informatik

Wissen für Fortgeschrittene der Informatik


1. Zur Geschichte history menue scroll up

Zum ASCII-Code hat die Nachrichtentechnik über einige kleine Umwege gefunden, denn anfänglich ging das Bestreben danach, die Anzahl der Bitkombinationen klein zu halten. Claude Baudot verwendete 5 Bits mit entsprechenden Konsequenzen - es musste Umgeschalten werden zwischen Buchstaben und Ziffern. Auf 32 Kombinationen sind eben nicht 26 Zeichen und 10 Ziffern zu codieren.
American Standard Code for Information Interchange (ASCII, alternativ US-ASCII, oft [æski] ausgesprochen) ist eine 7-Bit-Zeichenkodierung und bildet die US-Variante von ISO 646 sowie die Grundlage für spätere mehrbittige Zeichensätze und -kodierungen.
Der 1963 entwickelte ASCII, auch als ANSI X3.4-1986 bezeichnet, wurde im Jahr 1967 als Standard veröffentlicht und im Jahr 1986 zuletzt aktualisiert. Die Zeichenkodierung definiert 128 Zeichen, bestehend aus 33 nicht-druckbaren sowie 95 druckbaren. Letztere sind, beginnend mit dem Leerzeichen:

␣!"#$%&'()*+,-./0123456789:;<=>?
@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_
`abcdefghijklmnopqrstuvwxyz{|}~

Die Zeichen umfassen das lateinische Alphabet in Groß- und Kleinschreibung, die zehn arabischen Ziffern sowie einige Satz- und Steuerzeichen. Der Zeichenvorrat entspricht weitgehend dem einer Tastatur oder Schreibmaschine für die englische Sprache. In Computern und anderen elektronischen Geräten, die Text darstellen, wird dieser in der Regel gemäß ASCII oder abwärtskompatibel (z. B. ISO 8859, UTF-8) dazu gespeichert.

Spezielle Zeichen und Zahlencodes

Morse-Code

Baudot-Code

ISO 7-Bit-Code

Polybius-Code

8-Bit Lochstreifen

     

Eine Form der Zeichenkodierung war der Morsecode. Er wurde mit der Einführung von Fernschreibern aus den Telegrafennetzen verdrängt und durch den Baudot-Code und Murray-Code ersetzt. Vom Fünf-Bit-Murray-Code zum Sieben-Bit-ASCII war es dann nur noch ein kleiner Schritt – auch ASCII wurde zuerst für bestimmte amerikanische Fernschreiber-Modelle, wie den Teletype ASR33, eingesetzt. In den Anfängen des Computerzeitalters entwickelte sich ASCII zum Standard-Code für Schriftzeichen. Als Beispiel wurden viele Bildschirme (z. B. VT100) und Drucker nur mit ASCII angesteuert.
ASCII diente ursprünglich der Darstellung von Schriftzeichen der englischen Sprache. Die erste Version, noch ohne Kleinbuchstaben und mit kleinen Abweichungen vom heutigen ASCII, entstand im Jahr 1963. 1968 wurde dann der bis heute gültige ASCII festgelegt. Um später auch Sonderzeichen anderer Sprachen darstellen zu können (z. B. deutsche Umlaute), nahmen neue Kodierungen mit acht Bit pro Zeichen ASCII als kompatible Grundlage. Allerdings boten auch Acht-Bit-Codes, in denen ein Byte für ein Zeichen stand, zu wenig Platz, um alle Zeichen der menschlichen Schriftkultur gleichzeitig unterzubringen. Dadurch wurden mehrere verschiedene spezialisierte Erweiterungen notwendig. Daneben existieren vor allem für den ostasiatischen Raum einige ASCII-kompatible Kodierungen, die entweder zwischen verschiedenen Codetabellen umschalten oder mehr als ein Byte für jedes Nicht-ASCII-Zeichen benötigen.[1] Keine dieser Acht-Bit-Erweiterungen ist aber „ASCII“, denn das bezeichnet nur den einheitlichen Sieben-Bit-Code.
Für die Kodierung lateinischer Zeichen wird fast nur noch im Großrechnerbereich eine zu ASCII inkompatible Kodierung verwendet (EBCDIC).

... mehr zum Thema auch in Sachen HTML hier


2. Der ASCII-Code history menue scroll up

Der ASCII-Code generiert die Zeichen des englischsprachigen Alphabets in Groß- und Kleinschreibweise sowie die zehn Ziffern und einige Sonderzeichen inclusive 32 Steuerzeichen für Fernschreiber, denn dies war das Basis-Anliegen.

Programm zur Veranschaulichung Arbeitsweise eines Binärzählers

der Byte-Interpreter - hier als startbares Programm

der Byte-Interpreter zum Starten

Mathematische Umrechnungen des ASCII-Codes

 

... entwickelt im April 2019 kann dieses Tool aufgrund der Software-Umsetzung wesentlich mehr als andere Wandler - allerdings ist er auf 7- bzw. 8-Bitmuster bewusst eingeschränkt. DIe Codes werden als Bitmuster in jedem Falle fehlerfrei "ausgerechnet":

Character to ASCII-Bitmuster-Wandler

der Character to Bitmuster-Codewandler direkt zum Starten

... entwickelt über viele Jahre hinweg, aber eben auch mit alten Tools versehen (Bitmustervergleiche - alle händig eingetragen) (fehlerträchtig!) - alt aber gut - Bitmuster enthält das System aber nicht garantiert korrekt:

Character to ASCII-Dez- sowie HEX-Code-Wandler

der Byte-Interpreter zum Starten


3. ASCII-Code in der heute praktischen Anwendung history menue scroll up
Die ersten 32 ASCII-Zeichencodes (von 00 bis 1F) sind für Steuerzeichen (control character) reserviert; siehe dort für die Erklärung der Abkürzungen in obiger Tabelle. Das sind Zeichen, die keine Schriftzeichen darstellen, sondern die zur Steuerung von solchen Geräten dienen (oder dienten), die den ASCII verwenden (etwa Drucker). Steuerzeichen sind beispielsweise der Wagenrücklauf für den Zeilenumbruch oder Bell (die Glocke); ihre Definition ist historisch begründet.
Code 20 (SP) ist das Leerzeichen (engl. space oder blank), das in einem Text als Leer- und Trennzeichen zwischen Wörtern verwendet und auf der Tastatur durch die Leertaste erzeugt wird.
Die Codes 21 bis 7E sind alle druckbaren Zeichen, die sowohl Buchstaben, Ziffern und Satzzeichen (siehe Tabelle) enthalten.
Code 7FH (alle sieben Bits auf eins gesetzt) ist ein Sonderzeichen, das auch als „Löschzeichen“ bezeichnet wird (DEL). Dieser Code wurde früher wie ein Steuerzeichen verwendet, um auf Lochstreifen oder Lochkarten ein bereits gelochtes Zeichen nachträglich durch das Setzen aller Bits, d. h. durch Auslochen aller sieben Markierungen, löschen zu können – einmal vorhandene Löcher kann man schließlich nicht mehr rückgängig machen. Bereiche ohne Löcher (also mit dem Code 00) fanden sich am Anfang und Ende eines Lochstreifens (NUL).
Aus diesem Grund gehörten zum eigentlichen ASCII-Code nur 126 Zeichen, denn den Bitmustern 0 (0000000) und 127 (1111111) entsprachen keine Zeichencodes. Der Kodierung 0 wurde später in der Programmiersprache C die Bedeutung „Ende der Zeichenkette“ beigelegt; dem Zeichen 127 wurden verschiedene grafische Symbole zugeordnet.
ASCII-Codetabelle, in hexadezimaler Nummerierung
Code …0 …1 …2 …3 …4 …5 …6 …7 …8 …9 …A …B …C …D …E …F
0… NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI
1… DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US
2… SP ! " # $ % & ' ( ) * + , - . /
3… 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4… @ A B C D E F G H I J K L M N O
5… P Q R S T U V W X Y Z [ \ ] ^ _
6… ` a b c d e f g h i j k l m n o
7… p q r s t u v w x y z { | } ~ DEL

ASCII-Tabelle [Bearbeiten]

Die ASCII-Tabelle enthält alle Kodierungen des ASCII-Zeichensatzes; siehe Steuerzeichen für die Bedeutung der Abkürzungen in der rechten Spalte:

Dez Hex Okt Character
0 0x00 000 NUL
1 0x01 001 SOH
2 0x02 002 STX
3 0x03 003 ETX
4 0x04 004 EOT
5 0x05 005 ENQ
6 0x06 006 ACK
7 0x07 007 BEL
8 0x08 010 BS
9 0x09 011 TAB
10 0x0A 012 LF
11 0x0B 013 VT
12 0x0C 014 FF
13 0x0D 015 CR
14 0x0E 016 SO
15 0x0F 017 SI
16 0x10 020 DLE
17 0x11 021 DC1
18 0x12 022 DC2
19 0x13 023 DC3
20 0x14 024 DC4
21 0x15 025 NAK
22 0x16 026 SYN
23 0x17 027 ETB
24 0x18 030 CAN
25 0x19 031 EM
26 0x1A 032 SUB
27 0x1B 033 ESC
28 0x1C 034 FS
29 0x1D 035 GS
30 0x1E 036 RS
31 0x1F 037 US
Dez Hex Okt Character
32 0x20 040 SP
33 0x21 041  !
34 0x22 042 "
35 0x23 043 #
36 0x24 044 $
37 0x25 045  %
38 0x26 046 &
39 0x27 047 '
40 0x28 050
41 0x29 051  )
42 0x2A 052 *
43 0x2B 053 +
44 0x2C 054 ,
45 0x2D 055 -
46 0x2E 056 .
47 0x2F 057 /
48 0x30 060 0
49 0x31 061 1
50 0x32 062 2
51 0x33 063 3
52 0x34 064 4
53 0x35 065 5
54 0x36 066 6
55 0x37 067 7
56 0x38 070 8
57 0x39 071 9
58 0x3A 072  :
59 0x3B 073  ;
60 0x3C 074 <
61 0x3D 075 =
62 0x3E 076 >
63 0x3F 077  ?
Dez Hex Okt Character
64 0x40 100 @
65 0x41 101 A
66 0x42 102 B
67 0x43 103 C
68 0x44 104 D
69 0x45 105 E
70 0x46 106 F
71 0x47 107 G
72 0x48 110 H
73 0x49 111 I
74 0x4A 112 J
75 0x4B 113 K
76 0x4C 114 L
77 0x4D 115 M
78 0x4E 116 N
79 0x4F 117 O
80 0x50 120 P
81 0x51 121 Q
82 0x52 122 R
83 0x53 123 S
84 0x54 124 T
85 0x55 125 U
86 0x56 126 V
87 0x57 127 W
88 0x58 130 X
89 0x59 131 Y
90 0x5A 132 Z
91 0x5B 133 [
92 0x5C 134 \
93 0x5D 135 ]
94 0x5E 136 ^
95 0x5F 137 _
Dez Hex Okt Character
96 0x60 140 `
97 0x61 141 a
98 0x62 142 b
99 0x63 143 c
100 0x64 144 d
101 0x65 145 e
102 0x66 146 f
103 0x67 147 g
104 0x68 150 h
105 0x69 151 i
106 0x6A 152 j
107 0x6B 153 k
108 0x6C 154 l
109 0x6D 155 m
110 0x6E 156 n
111 0x6F 157 o
112 0x70 160 p
113 0x71 161 q
114 0x72 162 r
115 0x73 163 s
116 0x74 164 t
117 0x75 165 u
118 0x76 166 v
119 0x77 167 w
120 0x78 170 x
121 0x79 171 y
122 0x7A 172 z
123 0x7B 173 {
124 0x7C 174 |
125 0x7D 175 }
126 0x7E 176 ~
127 0x7F 177 DEL
... wirklich Wichtiges zum ASCII-Code, wenn man damit technisch richtig arbeiten muss - ansonsten genügt das oben stehende

ASCII control characters (character code 0-31)

... die ersten 32 Zeichen sind nicht druckbar - sie dienten ursprünglich der Steuerung der Ausgabegräte (z. B. Drucker aber insbesondere der Fernschreiber - Mutti und Vati evtl. noch bekannt als Telegrammschreiber)

DEC OCT HEX BIN Symbol HTML Number HTML Name Description
0 000 00 00000000 NUL &#000;   Null char
1 001 01 00000001 SOH &#001;   Start of Heading
2 002 02 00000010 STX &#002;   Start of Text
3 003 03 00000011 ETX &#003;   End of Text
4 004 04 00000100 EOT &#004;   End of Transmission
5 005 05 00000101 ENQ &#005;   Enquiry
6 006 06 00000110 ACK &#006;   Acknowledgment
7 007 07 00000111 BEL &#007;   Bell
8 010 08 00001000 BS &#008;   Back Space
9 011 09 00001001 HT &#009;   Horizontal Tab
10 012 0A 00001010 LF &#010;   Line Feed
11 013 0B 00001011 VT &#011;   Vertical Tab
12 014 0C 00001100 FF &#012;   Form Feed
13 015 0D 00001101 CR &#013;   Carriage Return
14 016 0E 00001110 SO &#014;   Shift Out / X-On
15 017 0F 00001111 SI &#015;   Shift In / X-Off
16 020 10 00010000 DLE &#016;   Data Line Escape
17 021 11 00010001 DC1 &#017;   Device Control 1 (oft. XON)
18 022 12 00010010 DC2 &#018;   Device Control 2
19 023 13 00010011 DC3 &#019;   Device Control 3 (oft. XOFF)
20 024 14 00010100 DC4 &#020;   Device Control 4
21 025 15 00010101 NAK &#021;   Negative Acknowledgement
22 026 16 00010110 SYN &#022;   Synchronous Idle
23 027 17 00010111 ETB &#023;   End of Transmit Block
24 030 18 00011000 CAN &#024;   Cancel
25 031 19 00011001 EM &#025;   End of Medium
26 032 1A 00011010 SUB &#026;   Substitute
27 033 1B 00011011 ESC &#027;   Escape
28 034 1C 00011100 FS &#028;   File Separator
29 035 1D 00011101 GS &#029;   Group Separator
30 036 1E 00011110 RS &#030;   Record Separator
31 037 1F 00011111 US &#031;   Unit Separator

ASCII printable characters (character code 32-127)

... die Codes von 32 bis 127 sind hier in verschiedenen Code-Interpretationen zusammengefasst und umspannt hier nun die druckbaren Zeichen (Buchstaben, Ziffern sowie einige spezifische sowie im anglo-amerikanischen Sprachraum gebräuchliche Zeichen). Alles Zeichen sind auch auf einer minimal 105 Zeichen umfassenden deutschen Tastatur anzutreffen!!!

DEC OCT HEX BIN Symbol HTML Number HTML Name Description
32 040 20 00100000   &#32;   Space
33 041 21 00100001 ! &#33;   Exclamation mark
34 042 22 00100010 " &#34; &quot; Double quotes (or speech marks)
35 043 23 00100011 # &#35;   Number
36 044 24 00100100 $ &#36;   Dollar
37 045 25 00100101 % &#37;   Procenttecken
38 046 26 00100110 & &#38; &amp; Ampersand
39 047 27 00100111 ' &#39;   Single quote
40 050 28 00101000 ( &#40;   Open parenthesis (or open bracket)
41 051 29 00101001 ) &#41;   Close parenthesis (or close bracket)
42 052 2A 00101010 * &#42;   Asterisk
43 053 2B 00101011 + &#43;   Plus
44 054 2C 00101100 , &#44;   Comma
45 055 2D 00101101 - &#45;   Hyphen
46 056 2E 00101110 . &#46;   Period, dot or full stop
47 057 2F 00101111 / &#47;   Slash or divide
48 060 30 00110000 0 &#48;   Zero
49 061 31 00110001 1 &#49;   One
50 062 32 00110010 2 &#50;   Two
51 063 33 00110011 3 &#51;   Three
52 064 34 00110100 4 &#52;   Four
53 065 35 00110101 5 &#53;   Five
54 066 36 00110110 6 &#54;   Six
55 067 37 00110111 7 &#55;   Seven
56 070 38 00111000 8 &#56;   Eight
57 071 39 00111001 9 &#57;   Nine
58 072 3A 00111010 : &#58;   Colon
59 073 3B 00111011 ; &#59;   Semicolon
60 074 3C 00111100 < &#60; &lt; Less than (or open angled bracket)
61 075 3D 00111101 = &#61;   Equals
62 076 3E 00111110 > &#62; &gt; Greater than (or close angled bracket)
63 077 3F 00111111 ? &#63;   Question mark
64 100 40 01000000 @ &#64;   At symbol
65 101 41 01000001 A &#65;   Uppercase A
66 102 42 01000010 B &#66;   Uppercase B
67 103 43 01000011 C &#67;   Uppercase C
68 104 44 01000100 D &#68;   Uppercase D
69 105 45 01000101 E &#69;   Uppercase E
70 106 46 01000110 F &#70;   Uppercase F
71 107 47 01000111 G &#71;   Uppercase G
72 110 48 01001000 H &#72;   Uppercase H
73 111 49 01001001 I &#73;   Uppercase I
74 112 4A 01001010 J &#74;   Uppercase J
75 113 4B 01001011 K &#75;   Uppercase K
76 114 4C 01001100 L &#76;   Uppercase L
77 115 4D 01001101 M &#77;   Uppercase M
78 116 4E 01001110 N &#78;   Uppercase N
79 117 4F 01001111 O &#79;   Uppercase O
80 120 50 01010000 P &#80;   Uppercase P
81 121 51 01010001 Q &#81;   Uppercase Q
82 122 52 01010010 R &#82;   Uppercase R
83 123 53 01010011 S &#83;   Uppercase S
84 124 54 01010100 T &#84;   Uppercase T
85 125 55 01010101 U &#85;   Uppercase U
86 126 56 01010110 V &#86;   Uppercase V
87 127 57 01010111 W &#87;   Uppercase W
88 130 58 01011000 X &#88;   Uppercase X
89 131 59 01011001 Y &#89;   Uppercase Y
90 132 5A 01011010 Z &#90;   Uppercase Z
91 133 5B 01011011 [ &#91;   Opening bracket
92 134 5C 01011100 \ &#92;   Backslash
93 135 5D 01011101 ] &#93;   Closing bracket
94 136 5E 01011110 ^ &#94;   Caret - circumflex
95 137 5F 01011111 _ &#95;   Underscore
96 140 60 01100000 ` &#96;   Grave accent
97 141 61 01100001 a &#97;   Lowercase a
98 142 62 01100010 b &#98;   Lowercase b
99 143 63 01100011 c &#99;   Lowercase c
100 144 64 01100100 d &#100;   Lowercase d
101 145 65 01100101 e &#101;   Lowercase e
102 146 66 01100110 f &#102;   Lowercase f
103 147 67 01100111 g &#103;   Lowercase g
104 150 68 01101000 h &#104;   Lowercase h
105 151 69 01101001 i &#105;   Lowercase i
106 152 6A 01101010 j &#106;   Lowercase j
107 153 6B 01101011 k &#107;   Lowercase k
108 154 6C 01101100 l &#108;   Lowercase l
109 155 6D 01101101 m &#109;   Lowercase m
110 156 6E 01101110 n &#110;   Lowercase n
111 157 6F 01101111 o &#111;   Lowercase o
112 160 70 01110000 p &#112;   Lowercase p
113 161 71 01110001 q &#113;   Lowercase q
114 162 72 01110010 r &#114;   Lowercase r
115 163 73 01110011 s &#115;   Lowercase s
116 164 74 01110100 t &#116;   Lowercase t
117 165 75 01110101 u &#117;   Lowercase u
118 166 76 01110110 v &#118;   Lowercase v
119 167 77 01110111 w &#119;   Lowercase w
120 170 78 01111000 x &#120;   Lowercase x
121 171 79 01111001 y &#121;   Lowercase y
122 172 7A 01111010 z &#122;   Lowercase z
123 173 7B 01111011 { &#123;   Opening brace
124 174 7C 01111100 | &#124;   Vertical bar
125 175 7D 01111101 } &#125;   Closing brace
126 176 7E 01111110 ~ &#126;   Equivalency sign - tilde
127 177 7F 01111111   &#127;   Delete

... die erweiterten ASCII-Codes (die Zeichen von 128-255)

... die folgende Tabelle ist veröffentlicht in der ISO 8859-1, auch bezeichnet als ISO Latin-1. Codes 129-159 enthalten auch die Microsoft® Windows Latin-1 erweiterte Zeichen.

DEC OCT HEX BIN Symbol HTML Number HTML Name Description
128 200 80 10000000 &#128; &euro; Euro sign
129 201 81 10000001        
130 202 82 10000010 &#130; &sbquo; Single low-9 quotation mark
131 203 83 10000011 ƒ &#131; &fnof; Latin small letter f with hook
132 204 84 10000100 &#132; &bdquo; Double low-9 quotation mark
133 205 85 10000101 &#133; &hellip; Horizontal ellipsis
134 206 86 10000110 &#134; &dagger; Dagger
135 207 87 10000111 &#135; &Dagger; Double dagger
136 210 88 10001000 ˆ &#136; &circ; Modifier letter circumflex accent
137 211 89 10001001 &#137; &permil; Per mille sign
138 212 8A 10001010 Š &#138; &Scaron; Latin capital letter S with caron
139 213 8B 10001011 &#139; &lsaquo; Single left-pointing angle quotation
140 214 8C 10001100 Π&#140; &OElig; Latin capital ligature OE
141 215 8D 10001101        
142 216 8E 10001110 Ž &#142;   Latin captial letter Z with caron
143 217 8F 10001111        
144 220 90 10010000        
145 221 91 10010001 &#145; &lsquo; Left single quotation mark
146 222 92 10010010 &#146; &rsquo; Right single quotation mark
147 223 93 10010011 &#147; &ldquo; Left double quotation mark
148 224 94 10010100 &#148; &rdquo; Right double quotation mark
149 225 95 10010101 &#149; &bull; Bullet
150 226 96 10010110 &#150; &ndash; En dash
151 227 97 10010111 &#151; &mdash; Em dash
152 230 98 10011000 ˜ &#152; &tilde; Small tilde
153 231 99 10011001 &#153; &trade; Trade mark sign
154 232 9A 10011010 š &#154; &scaron; Latin small letter S with caron
155 233 9B 10011011 &#155; &rsaquo; Single right-pointing angle quotation mark
156 234 9C 10011100 œ &#156; &oelig; Latin small ligature oe
157 235 9D 10011101        
158 236 9E 10011110 ž &#158;   Latin small letter z with caron
159 237 9F 10011111 Ÿ &#159; &yuml; Latin capital letter Y with diaeresis
160 240 A0 10100000   &#160; &nbsp; Non-breaking space
161 241 A1 10100001 ¡ &#161; &iexcl; Inverted exclamation mark
162 242 A2 10100010 ¢ &#162; &cent; Cent sign
163 243 A3 10100011 £ &#163; &pound; Pound sign
164 244 A4 10100100 ¤ &#164; &curren; Currency sign
165 245 A5 10100101 ¥ &#165; &yen; Yen sign
166 246 A6 10100110 ¦ &#166; &brvbar; Pipe, Broken vertical bar
167 247 A7 10100111 § &#167; &sect; Section sign
168 250 A8 10101000 ¨ &#168; &uml; Spacing diaeresis - umlaut
169 251 A9 10101001 © &#169; &copy; Copyright sign
170 252 AA 10101010 ª &#170; &ordf; Feminine ordinal indicator
171 253 AB 10101011 « &#171; &laquo; Left double angle quotes
172 254 AC 10101100 ¬ &#172; &not; Not sign
173 255 AD 10101101 ­ &#173; &shy; Soft hyphen
174 256 AE 10101110 ® &#174; &reg; Registered trade mark sign
175 257 AF 10101111 ¯ &#175; &macr; Spacing macron - overline
176 260 B0 10110000 ° &#176; &deg; Degree sign
177 261 B1 10110001 ± &#177; &plusmn; Plus-or-minus sign
178 262 B2 10110010 ² &#178; &sup2; Superscript two - squared
179 263 B3 10110011 ³ &#179; &sup3; Superscript three - cubed
180 264 B4 10110100 ´ &#180; &acute; Acute accent - spacing acute
181 265 B5 10110101 µ &#181; &micro; Micro sign
182 266 B6 10110110 &#182; &para; Pilcrow sign - paragraph sign
183 267 B7 10110111 · &#183; &middot; Middle dot - Georgian comma
184 270 B8 10111000 ¸ &#184; &cedil; Spacing cedilla
185 271 B9 10111001 ¹ &#185; &sup1; Superscript one
186 272 BA 10111010 º &#186; &ordm; Masculine ordinal indicator
187 273 BB 10111011 » &#187; &raquo; Right double angle quotes
188 274 BC 10111100 ¼ &#188; &frac14; Fraction one quarter
189 275 BD 10111101 ½ &#189; &frac12; Fraction one half
190 276 BE 10111110 ¾ &#190; &frac34; Fraction three quarters
191 277 BF 10111111 ¿ &#191; &iquest; Inverted question mark
192 300 C0 11000000 À &#192; &Agrave; Latin capital letter A with grave
193 301 C1 11000001 Á &#193; &Aacute; Latin capital letter A with acute
194 302 C2 11000010 Â &#194; &Acirc; Latin capital letter A with circumflex
195 303 C3 11000011 Ã &#195; &Atilde; Latin capital letter A with tilde
196 304 C4 11000100 Ä &#196; &Auml; Latin capital letter A with diaeresis
197 305 C5 11000101 Å &#197; &Aring; Latin capital letter A with ring above
198 306 C6 11000110 Æ &#198; &AElig; Latin capital letter AE
199 307 C7 11000111 Ç &#199; &Ccedil; Latin capital letter C with cedilla
200 310 C8 11001000 È &#200; &Egrave; Latin capital letter E with grave
201 311 C9 11001001 É &#201; &Eacute; Latin capital letter E with acute
202 312 CA 11001010 Ê &#202; &Ecirc; Latin capital letter E with circumflex
203 313 CB 11001011 Ë &#203; &Euml; Latin capital letter E with diaeresis
204 314 CC 11001100 Ì &#204; &Igrave; Latin capital letter I with grave
205 315 CD 11001101 Í &#205; &Iacute; Latin capital letter I with acute
206 316 CE 11001110 Î &#206; &Icirc; Latin capital letter I with circumflex
207 317 CF 11001111 Ï &#207; &Iuml; Latin capital letter I with diaeresis
208 320 D0 11010000 Ð &#208; &ETH; Latin capital letter ETH
209 321 D1 11010001 Ñ &#209; &Ntilde; Latin capital letter N with tilde
210 322 D2 11010010 Ò &#210; &Ograve; Latin capital letter O with grave
211 323 D3 11010011 Ó &#211; &Oacute; Latin capital letter O with acute
212 324 D4 11010100 Ô &#212; &Ocirc; Latin capital letter O with circumflex
213 325 D5 11010101 Õ &#213; &Otilde; Latin capital letter O with tilde
214 326 D6 11010110 Ö &#214; &Ouml; Latin capital letter O with diaeresis
215 327 D7 11010111 × &#215; &times; Multiplication sign
216 330 D8 11011000 Ø &#216; &Oslash; Latin capital letter O with slash
217 331 D9 11011001 Ù &#217; &Ugrave; Latin capital letter U with grave
218 332 DA 11011010 Ú &#218; &Uacute; Latin capital letter U with acute
219 333 DB 11011011 Û &#219; &Ucirc; Latin capital letter U with circumflex
220 334 DC 11011100 Ü &#220; &Uuml; Latin capital letter U with diaeresis
221 335 DD 11011101 Ý &#221; &Yacute; Latin capital letter Y with acute
222 336 DE 11011110 Þ &#222; &THORN; Latin capital letter THORN
223 337 DF 11011111 ß &#223; &szlig; Latin small letter sharp s - ess-zed
224 340 E0 11100000 à &#224; &agrave; Latin small letter a with grave
225 341 E1 11100001 á &#225; &aacute; Latin small letter a with acute
226 342 E2 11100010 â &#226; &acirc; Latin small letter a with circumflex
227 343 E3 11100011 ã &#227; &atilde; Latin small letter a with tilde
228 344 E4 11100100 ä &#228; &auml; Latin small letter a with diaeresis
229 345 E5 11100101 å &#229; &aring; Latin small letter a with ring above
230 346 E6 11100110 æ &#230; &aelig; Latin small letter ae
231 347 E7 11100111 ç &#231; &ccedil; Latin small letter c with cedilla
232 350 E8 11101000 è &#232; &egrave; Latin small letter e with grave
233 351 E9 11101001 é &#233; &eacute; Latin small letter e with acute
234 352 EA 11101010 ê &#234; &ecirc; Latin small letter e with circumflex
235 353 EB 11101011 ë &#235; &euml; Latin small letter e with diaeresis
236 354 EC 11101100 ì &#236; &igrave; Latin small letter i with grave
237 355 ED 11101101 í &#237; &iacute; Latin small letter i with acute
238 356 EE 11101110 î &#238; &icirc; Latin small letter i with circumflex
239 357 EF 11101111 ï &#239; &iuml; Latin small letter i with diaeresis
240 360 F0 11110000 ð &#240; &eth; Latin small letter eth
241 361 F1 11110001 ñ &#241; &ntilde; Latin small letter n with tilde
242 362 F2 11110010 ò &#242; &ograve; Latin small letter o with grave
243 363 F3 11110011 ó &#243; &oacute; Latin small letter o with acute
244 364 F4 11110100 ô &#244; &ocirc; Latin small letter o with circumflex
245 365 F5 11110101 õ &#245; &otilde; Latin small letter o with tilde
246 366 F6 11110110 ö &#246; &ouml; Latin small letter o with diaeresis
247 367 F7 11110111 ÷ &#247; &divide; Division sign
248 370 F8 11111000 ø &#248; &oslash; Latin small letter o with slash
249 371 F9 11111001 ù &#249; &ugrave; Latin small letter u with grave
250 372 FA 11111010 ú &#250; &uacute; Latin small letter u with acute
251 373 FB 11111011 û &#251; &ucirc; Latin small letter u with circumflex
252 374 FC 11111100 ü &#252; &uuml; Latin small letter u with diaeresis
253 375 FD 11111101 ý &#253; &yacute; Latin small letter y with acute
254 376 FE 11111110 þ &#254; &thorn; Latin small letter thorn
255 377 FF 11111111 ÿ &#255; &yuml; Latin small letter y with diaeresis


4. Erweiterungen des ASCII-Zeichensatzes history menue scroll up

ASCII enthält keine diakritischen Zeichen, die in fast allen Sprachen auf der Basis des lateinischen Alphabets verwendet werden. Der internationale Standard ISO 646 (1972) war der erste Versuch, dieses Problem anzugehen, was allerdings zu Kompatibilitätsproblemen führte. Er ist immer noch ein Sieben-Bit-Code, und weil keine anderen Codes verfügbar waren, wurden einige Codes in neuen Varianten verwendet.
So ist etwa die ASCII-Position 93 für die rechte eckige Klammer (]) in der deutschen Zeichensatz-Variante ISO 646-DE durch das große U mit
Trema (Umlaut) (Ü) und in der dänischen Variante ISO 646-DK durch das große A mit Ring (Kroužek) (Å) ersetzt. Bei der Programmierung mussten dann die in vielen Programmiersprachen benutzten eckigen Klammern durch die entsprechenden nationalen Sonderzeichen ersetzt werden. Das verringerte die Lesbarkeit des Programmcodes und führte oft zu ungewollt komischen Ergebnissen, indem etwa die Einschaltmeldung des Apple II von „APPLE ][“ zu „APPLE ÜÄ“ mutierte.
Verschiedene Hersteller entwickelten eigene Acht-Bit-Codes. Der
Codepage 437 genannte Code war lange Zeit der am weitesten verbreitete, er kam auf dem IBM-PC unter MS-DOS, und kommt heute noch in DOS- oder Eingabeaufforderungsfenstern von Microsoft Windows, zur Anwendung.
Auch bei späteren Standards wie ISO 8859 wurden acht Bits verwendet. Dabei existieren mehrere Varianten, zum Beispiel ISO 8859-1 für die westeuropäischen Sprachen. Deutschsprachige Versionen von Windows (außer DOS-Fenster) verwenden die auf ISO 8859-1 aufbauende Kodierung Windows-1252 – daher sehen z. B. bei unter DOS erstellten Textdateien die deutschen Umlaute falsch aus, wenn man sie unter Windows ansieht.
Viele ältere Programme, die das achte Bit für eigene Zwecke verwendeten, konnten damit nicht umgehen. Sie wurden im Laufe der Zeit oft den neuen Erfordernissen angepasst.
Um den verschiedenen Anforderungen der verschiedenen Sprachen gerecht zu werden, wurde der
Unicode (in seinem Zeichenvorrat identisch mit ISO 10646) entwickelt. Er verwendet bis zu 32 Bit pro Zeichen und könnte somit über vier Milliarden verschiedene Zeichen unterscheiden, wird jedoch auf etwa 1 Million erlaubte Code-Werte eingeschränkt. Damit können alle bislang von Menschen verwendeten Schriftzeichen dargestellt werden, sofern sie in den Unicode-Standard aufgenommen wurden. UTF-8 ist eine 8-Bit-Kodierung von Unicode, die zu ASCII abwärtskompatibel ist. Ein Zeichen kann dabei ein bis vier 8-Bit-Wörter einnehmen. Sieben-Bit-Varianten müssen nicht mehr verwendet werden, dennoch kann Unicode auch mit Hilfe von UTF-7 in sieben Bit kodiert werden. UTF-8 entwickelt sich zur Zeit (2005) zum einheitlichen Standard unter den meisten Betriebssystemen. So nutzen unter anderem Apples Mac OS X sowie einige Linux-Distributionen standardmäßig UTF-8 und immer mehr Webseiten werden in UTF-8 erstellt.
ASCII enthält nur wenige Zeichen, die allgemein verbindlich zur Formatierung oder Strukturierung von Text verwendet werden; diese gingen aus den Steuerbefehlen der
Fernschreiber hervor. Hierzu zählen insbesondere der Zeilenvorschub (Linefeed), der Wagenrücklauf (Carriage Return), der horizontale Tabulator, der Seitenvorschub (Form Feed) und der vertikale Tabulator. In typischen ASCII-Textdateien findet sich neben den druckbaren Zeichen meist nur noch der Wagenrücklauf oder der Zeilenvorschub, um das Zeilenende zu markieren, wobei in DOS- und Windows-Systemen üblicherweise beide nacheinander verwendet werden, bei älteren Apple- und Commodore-Rechnern (ohne Amiga) nur der Wagenrücklauf, auf Unix-artigen Systemen sowie Amiga-Systemen nur der Zeilenvorschub. Die Verwendung weiterer Zeichen zur Textformatierung ist bei verschiedenen Anwendungsprogrammen zur Textverarbeitung unterschiedlich. Zur Formatierung von Text werden inzwischen eher Markup-Sprachen wie z. B. HTML verwendet.

Kompatible Zeichenkodierungen

Viele Zeichenkodierungen sind so entworfen, dass sie für Zeichen im Bereich 0…127 den gleichen Code verwenden wie ASCII und den Bereich über 127 für weitere Zeichen benutzen.

Kodierungen mit fester Länge (Auswahl)

Hier steht eine feste Anzahl Bytes für jeweils ein Zeichen. In den meisten Kodierungen ist das ein Byte pro Zeichen, bei den ostasiatischen Schriften zwei oder mehr Byte pro Zeichen.

Kodierungen mit variabler Länge

Um mehr Zeichen kodieren zu können, werden die Zeichen 0…127 in einem Byte kodiert, andere Zeichen werden durch mehrere Bytes mit Werten von über 127 kodiert.

  • UTF-8 für Unicode
  • Big5 für traditionelles Chinesisch (Taiwan, Auslandschinesen)
  • EUC (Extended UNIX Coding) für mehrere ostasiatische Sprachen.
  • GB (Guojia Biaozhun) für vereinfachtes Chinesisch (VR China)


5. Links & verwandte Themen history menue scroll up

Nun ist der ASCII-Code wie kaum ein anderer Code prätestiniert, zu eigentlich allem, was mit Computern zu tun hat (und das zieht sich bis auf die Ebene der Mikrocontroller herunter) ein verwandtschaftliches Verhältnis zu besitzen.

die V24-Schnitttstelle

     

... Original-ASCII-Seite

Murray-Code

ISO-7-Bit Code

8-Bit Lochstreifen

ISO 7-Bit-Codes

Unicodes

ISO Codes

ANSI-Code



zur Hauptseite
© Samuel-von-Pufendorf-Gymnasium Flöha © Frank Rost am 18. November 2009

... dieser Text wurde nach den Regeln irgendeiner Rechtschreibreform verfasst - ich hab' irgendwann einmal beschlossen, an diesem Zirkus nicht mehr teilzunehemn ;-)

„Dieses Land braucht eine Steuerreform, dieses Land braucht eine Rentenreform - wir schreiben Schiffahrt mit drei „f“!“

Diddi Hallervorden, dt. Komiker und Kabarettist

Diese Seite wurde ohne Zusatz irgendwelcher Konversationsstoffe erstellt ;-)