Die westliche Version von Windows (enthält Englisch, Französisch und Deutsch) verwendet den Zeichensatz ANSI Latin-1 (1252). Andere Windows-Versionen verwenden hingegen einen anderen Zeichensatz. Die japanische Version arbeitet beispielsweise mit dem Zeichensatz Shift-JIS (Code-Page 932), in dem die japanischen Schriftzeichen als Multibyte-Zeichencodes dargestellt werden.
Im Allgemeinen gibt es drei Arten von Zeichensätzen:
In einem Multibyte-Zeichensatz werden einige Zeichen durch ein Byte, andere durch mehrere Bytes dargestellt. Das erste Byte eines Multibyte-Zeichens wird als führendes Byte bezeichnet. Im Allgemeinen stimmen die ersten 128 Zeichen eines Multibyte-Zeichensatzes mit den 7-Bit-ASCII-Zeichen überein. Jedes Byte, dessen Ordinalwert größer ist als 127, fungiert als führendes Byte eines Multibyte-Zeichens. Nur Single-Byte-Zeichensätze können den Nullwert (#0) enthalten. Multibyte-Zeichensätze – insbesondere Doppelbyte-Zeichensätze (DBCS) – werden größtenteils für asiatische Sprachen eingesetzt.
|
Copyright© 2008 CodeGear™. Alle Rechte vorbehalten.
|
|
Was denken Sie über dieses Thema? Feedback senden!
|