Arbeiten mit Zeichensätzen

Früher haben die meisten Computer den gleichen Zeichensatz verwendet, um große und kleine Buchstaben, Zahlen und Satzzeichen darzustellen. Dieser Zeichensatz nennt sich ASCII. ASCII ist jedoch relativ eingeschränkt, d. h., die Alphabete vieler anderer Sprachen werden nicht unterstützt. Verschiedene Zeichensätze wurden entwickelt, um allen Computer-Anwendern weltweit gerecht zu werden. Diese neuen Zeichensätze werden häufig mit einer Nummer betitelt, wie z. B. Codepage 850 oder ISO-8859-1.

Zeichensätze bestehen aus Zeichen-Codes - den Nummern, die den einzelnen Zeichen zugewiesen sind. Der Rechner verwendet sie, um ein Zeichen zu identifizieren. Wenn Sie zum Beispiel in ASCII ein großes A eingeben, erkennt der Rechner den Zeichen-Code 65, wenn Sie ein B eingeben, erkennt der Computer den Zeichen-Code 66. Sowohl die Zeichensätze der Codepage 850 als auch ISO-8859-1-Zeichensätze enthalten Buchstaben mit Akzent, allerdings wird für den Buchstaben é bei 850 der Zeichen-Code 130 und bei 8859-1 der Code 233 verwendet. Um diesem Durcheinander ein Ende zu bereiten, arbeiten Programmierer derzeit an einem universellen Zeichensatz, der jedes Zeichen aus jeder Sprache enthält. Dieser Zeichensatz nennt sich Unicode.

Zeichen werden in NetObjects Fusion korrekt angezeigt, da sie in Unicode gespeichert werden. Wenn NetObjects Fusion eine Seite publiziert oder eine Vorschau davon anzeigt, wird der Text von Unicode in den für die Site oder für die einzelne Seite festgelegten Zeichensatz umgewandelt.

Sie geben zum Beispiel griechische Buchstaben auf einer Seite ein, legen den Zeichensatz Westeuropa (ISO-8859-1) dafür fest und zeigen eine Vorschau der Seite an. Da die griechischen Buchstaben nicht über entsprechende Zeichen-Codes im Zeichensatz Westeuropa verfügen, werden sie wahrscheinlich als Fragezeichen dargestellt. Wenn Sie sicherstellen möchten, dass die griechischen Buchstaben auf einer mit NetObjects Fusion gestalteten Seite in der Vorschau und bei der Publizierung richtig angezeigt werden, sollten Sie einen Zeichensatz auswählen, in dem griechische Zeichen enthalten sind. Dieser Zeichensatz wird in den Zeichensatz-Parameter des generierten HTML-MTA-Tags eingefügt, anhand dessen der Browser erkennt, wie er Zeichen anzeigen soll.

Wenn eine Seite mehrere Sprachen mit unterschiedlichen Zeichensätzen enthält (z. B. Deutsch rechts und Griechisch links), können Sie Unicode (UTF-8) oder 2-Byte-Unicode (UCS-2) als Zeichensatz verwenden, um sicherzustellen, dass alle Zeichen vom Browser richtig dargestellt werden. Beachten Sie, dass der Unicode sich noch in der Entwicklungsphase befindet, d. h., er ist noch nicht vollständig fertig gestellt. Die Zeichen-Codes für die meisten Zeichen der heute von Computern genutzten Sprachen sind jedoch bereits vorhanden.