American Singles

Spannweite class="mw-headline" id="Codierung">Codierung Der ASCII-Code ist ein Redirect zu diesem Aufsatz. Nähere Informationen finden Sie unter ASCII (Begriffserklärung). Bei dem American Standard Code for Information Interchange handelt es sich um eine 7-Bit-Zeichencodierung (ASCII, bzw. US-ASCII, oft ausgesprochen[?æski]); sie korrespondiert mit der US-Variante der ISO 646 und bildet die Basis für eine weitere, stärker bitbasierte Codierung von Zeichensätzen.

Dieser ASCII-Code wurde erstmals am 17. Juli 1963 von der American Standards Alliance (ASA) als Norm ASA X3.4-1963[1]:1[2]:50 und 1967/1968[3] verabschiedet und 1986 (ANSI X3.4-1986)[4] von ihren Nachfolgeinstituten grundlegend überarbeitet. Bei der Zeichencodierung werden 128 Anschläge festgelegt, die aus 33 nicht bedruckbaren und 95 bedruckbaren Anschlägen bestehen. Bedruckbare Buchstaben sind, angefangen beim Leerzeichen: ! "#$%&'()*+,-./0123456789:;?

Zu den ausdruckbaren Buchstaben gehören das Groß- und Kleinbuchstabenalphabet, die zehn Arabischziffern sowie einige Zeichen für Interpunktion (Satzzeichen, Wortzeichen) und andere Umlaute. Bei Rechnern und anderen Elektronikgeräten, die Texte anzeigen, wird sie in der Regel nach ASCII oder rückwärtskompatibel abgespeichert (ISO 8859, Unicode). Nicht druckbare Kontrollzeichen beinhalten Ausgangszeichen wie Zeilenumbruch- oder Registerzeichen, Logzeichen wie Ende der Übertragung oder Rückmeldung und Separatoren wie Datensatztrenner.

Jedes einzelne Merkmal ist mit einem 7-Bit-Muster versehen. Weil jedes der Bits zwei unterschiedliche Wert annimmt, gibt es 27 = 128 unterschiedliche Bits, die auch als ganze Zahl 0-127 (hexadezimal 00h-7Fh) interpretierbar sind. Die achte, nicht für ASCII verwendete Stelle kann zur Fehlerkorrektur (Paritätsbit) auf den Kommunikationsstrecken oder für andere Steueraufgaben genutzt werden.

Heutzutage wird es jedoch beinahe immer benutzt, um ASCII auf 8-Bit-Code zu erweitern. Sie sind weitestgehend mit dem Original-ASCII-Standard vereinbar, so dass alle in ASCII festgelegten Buchstaben auch in den einzelnen Extensions mit den selben Bitmustern codiert werden. Als einfachste Extensions gelten Codierungen mit sprachenspezifischen Buchstaben, die nicht im grundlegenden Latin-Alphabet vorkommt.

Sie repräsentieren keine Buchstaben, sondern werden (oder wurden) zur Ansteuerung von ASCII-fähigen Endgeräten (z.B. Drucker) benutzt. Der Kode 0x20 (SP) ist das Leerschlagzeichen, das in einem Dokument als Leerschlag und Separator zwischen den Worten benutzt wird und von der Leerzeile auf der Klaviaturzeugt wird.

Unter den Kennziffern 0x21 bis 0x7E versteht man druckfähige Schriftzeichen, die Briefe, Zahlen und Sonderzeichen (Satzzeichen, Wortzeichen) enthalten. Der Kode 0x7F (alle sieben Bit auf eins gesetzt) ist ein spezielles Symbol, auch bekannt als DEL (delete character). In der Vergangenheit wurde dieser Kode wie ein Kontrollzeichen benutzt, um ein bereits gestanztes Schriftzeichen durch die Einstellung aller Bit, d.h. durch Ausstanzen aller sieben Marken, zu entfernen.

Flächen ohne Bohrungen (d.h. mit dem Kode 0x00) wurden hauptsächlich am Bandanfang und -ende (NUL) gefunden. Daher gehören nur 126 Buchstaben zum aktuellen ASCII, da die Bitmuster 0 (0000000) und 127 (111111111) keinem Zeichencode entsprechen. Später wurde der Kode 0 als "Ende der Zeichenkette" in der Sprache C gedeutet; dem Kode 127 wurden diverse graphische Darstellungen beigefügt.

Von 5-Bit Murray-Code zu 7-Bit-ASCII war es nur ein kleiner Fortschritt - ASCII wurde auch für gewisse Modelle des amerikanischen Fernschreibens verwendet, wie z.B. den Fernschreiber ASR33. Der erste, noch ohne Großbuchstaben und mit kleinen Unterschieden zum aktuellen ASCII für die Steuer- und Umlaute, wurde 1963 erstellt. Der folgende Datensatz muss überarbeitet werden: Jennings: USAS X3.4-1967 - gemäß....[folgt] "approved" 1968, aber auch X3.4-1968 existierte.

Im Jahre 1968 wurde der heute noch geltende ASCII-Code definiert. Zu Beginn des Computer-Zeitalters wurde ASCII zum Standard-Code für die Schrift. Beispielsweise wurden viele Endgeräte (VT100) und Printer nur über ASCII gesteuert. Bei der Verschlüsselung von lateinischen Buchstaben wird EBCDIC, das IBM für sein System/360 neben ASCII entwickelt hat, damals ein ernstzunehmender Wettbewerber war und mit ASCII nicht kompatibel ist, nahezu ausschließlich auf Mainframes eingesetzt.

Die IBM selbst benutzte ASCII für die internen Belege. Der ASCII -Code wurde von Lyndon B. Johnsons Vereinbarung von 1968 unterstützt, ihn in Regierungsstellen zu nutzen. Im Jahre 1963 wurde mit dem International Alphabet 5 (IA5) eine 7-Bit-Kodierung auf ASCII-Basis als ISO 646 standardisiert. Bis auf eine Stelle ist die Referenzausführung (ISO 646-IRV) ASCII-konform.

Weil diese die in der Programmiersprache verwendeten Buchstaben enthalten, vor allem die unterschiedlichen Brackets, wurden die Sprachen für die internationale Ausrichtung durch alternative Kombinationen (Digraphen) erweitert. Für die Codierung wurden nur Buchstaben aus dem unveränderlichen Teil der ISO 646 benutzt. Um die Inkompatibilität der nationalen 7-Bit-Varianten von ASCII zu überwinden, entwickelte man zunächst eigene ASCII-kompatible 8-Bit-Codes (d.h. solche, die an den ersten 128 Stellen mit ASCII übereinstimmen).

Die Codeseite 437 war lange Zeit der am meisten verwendete Quellcode, sie kam auf dem IBM-PC unter dem englischen MS-DOS und wird auch heute noch im DOS-Fenster des englischen Microsoft Windows eingesetzt. Seit MS-DOS 3.3 ist die westliche Codeseite 850 der Maßstab in ihren Deutschlandinstallationen. Acht Bit wurden auch für spätere Normen wie ISO 8859 eingesetzt.

Deutsche Sprachversionen von Windows (außer DOS-Fenster) benutzen die ISO 8859-1-basierte Codierung Windows-1252 - daher erscheinen z.B. die englischen Umlaute beim Erzeugen von Text-Dateien unter DOS und werden unter Windows angezeigt. Selbst 8-Bit-Codes, bei denen ein einziges Wort für ein einzelnes Wort steht, bieten zu wenig Raum, um alle Buchstaben der Schreibkultur des Menschen auf einmal aufzunehmen.

Dies machte mehrere unterschiedliche spezielle Verlängerungen erforderlich. Zusätzlich gibt es einige ASCII-kompatible Codierungen, insbesondere für Ostasien, die entweder zwischen unterschiedlichen Code-Tabellen wechseln oder mehr als ein einzelnes Bytes pro ASCII-unabhängigem Charakter ausgeben. 5 ] Keine dieser acht Bit-Erweiterungen ist jedoch "ASCII", da sich dies nur auf den uniformen siebenbitigen Code bezieht. Es benutzt bis zu 32 Bits pro Buchstabe und könnte daher über vier Billionen unterschiedliche Buchstaben ausmachen.

Bei UTF-8 handelt es sich um eine 8-Bit-Verschlüsselung von UTF-8, die rückwärtskompatibel zu ASCII ist. Für ein beliebiges Wort können ein bis vier Wörter mit 8 Bits benutzt werden. Es müssen keine sieben Bitvarianten mehr benutzt werden, aber mit UTF-7 kann auch in sieben Bits codiert werden. Die UTF-8 wird sich (2011) zum gleichen Standart unter den meisten Betriebsystemen entwickeln.

Der ASCII-Code besteht nur aus wenigen Buchstaben, die allgemein verbindlich zur Textformatierung oder Textstrukturierung dienen; diese wurden aus den Steuerkommandos des Telex abgeleitet. Bei herkömmlichen ASCII-Textdateien gibt es neben den druckfähigen Schriftzeichen in der Regel nur den Zeilenumbruch oder den Zeilenumbruch, bei DOS- und Windows-Systemen werden beide in der Regel hintereinander benutzt, bei alten Apple- und Commodore-Rechnern (ohne Amiga) nur den Zeilenumbruch und bei Unix- und Amigasystemen nur den Zeilenumbruch.

Der Einsatz zusätzlicher Buchstaben für die Textgestaltung wird anders behandelt. Markup-Sprachen wie z. B. HMTL werden nun zur Textgestaltung eingesetzt. Bei den meisten Zeichencodierungen wird der gleiche Kode für Buchstaben zwischen 0.... 127 als ASCII und der Wertebereich über 127 für zusätzliche Buchstaben benutzt.

Dabei steht eine festgelegte Zahl von Datenbytes für je ein beliebiges Character. Bei den meisten Codierungen ist dies ein einziges Bit pro Buchstabe - Single Bytes Zeichensatz oder kurz SBCS. Die ostasiatische Schrift hat zwei oder mehr Buchstaben, so dass diese Codierungen nicht mehr ASCII-kompatibel sind. Zur Kodierung mehrerer Buchstaben werden die Buchstaben 0 bis 127 in einem einzigen Buchstaben codiert, andere Buchstaben werden durch mehrere Buchstaben mit einem Wert größer als 127 codiert:

Hochsprung American Standards Society (Hrsg.): Amerikanischer Standard-Code für den Informationsaustausch. Springen auf ? Fred W. Smith: Neuer amerikanischer Standard-Code für den Informationsaustausch. Highspringen ? United States of America Standards Institute (Hrsg.) : US-amerikanischer Standard-Code für den Informationsaustausch USAS X3.4-1967. 1967. Hochsprung ? American National Standards Institute (Hrsg.): Amerikanischer Nationaler Standard für Informationssysteme - Codierte Zeichensätze - 7-Bit American Standard Code for Information Exchange (7-Bit ASCII) ANSI X3.4-1986.

Impressum

Datenschutzerklärung

Mehr zum Thema