RAD Studio
InhaltIndex
Zurücknach obenWeiter
Zeichensätze

Die westliche Version von Windows (enthält Englisch, Französisch und Deutsch) verwendet den Zeichensatz ANSI Latin-1 (1252). Andere Windows-Versionen verwenden hingegen einen anderen Zeichensatz. Die japanische Version arbeitet beispielsweise mit dem Zeichensatz Shift-JIS (Code-Page 932), in dem die japanischen Schriftzeichen als Multibyte-Zeichencodes dargestellt werden. 

Im Allgemeinen gibt es drei Arten von Zeichensätzen:

  • Single-Byte
  • Multibyte
  • 32-Bit-Zeichen
Windows und Linux unterstützen Single-Byte- und Multibyte-Zeichensätze sowie Unicode. Bei einem Single-Byte-Zeichensatz stellt jedes Byte in einem String ein Zeichen dar. Der von vielen westlichen Betriebssystemen verwendete ANSI-Zeichensatz ist ein Single-Byte-Zeichensatz. 

In einem Multibyte-Zeichensatz werden einige Zeichen durch ein Byte, andere durch mehrere Bytes dargestellt. Das erste Byte eines Multibyte-Zeichens wird als führendes Byte bezeichnet. Im Allgemeinen stimmen die ersten 128 Zeichen eines Multibyte-Zeichensatzes mit den 7-Bit-ASCII-Zeichen überein. Jedes Byte, dessen Ordinalwert größer ist als 127, fungiert als führendes Byte eines Multibyte-Zeichens. Nur Single-Byte-Zeichensätze können den Nullwert (#0) enthalten. Multibyte-Zeichensätze – insbesondere Doppelbyte-Zeichensätze (DBCS) – werden größtenteils für asiatische Sprachen eingesetzt.

Copyright© 2008 CodeGear™. Alle Rechte vorbehalten.
Was denken Sie über dieses Thema? Feedback senden!