Unicode: Zeichen- und Konvertierungstabellen

Eine Auswahl der vom Unicode-Consortium veröffentlichten Tabellen des Zeichencodes Unicode: Codierung der einzelnen Zeichen, Eigenschaften der Zeichen, Konvertierung zu anderen Zeichencodes, insbesondere der Serie ISO 8859-x

Auf dem FTP-Server des Unicode-Consortiums befinden sich eine große Anzahl von Dokumenten und Code-Tabellen. In der Tabelle sind Links auf eine kleine Auswahl von ihnen zusammengestellt. Wenn Sie etwas vermissen, suchen Sie bitte auch auf dem FTP-Server von Unicode.

Im Gegensatz zu einer früheren Version dieser WWW-Seite enthält die jetzige nur noch Links und keine Daten mehr. Man greift also automatisch immer auf die aktuelle Version beim Unicode-Konsortium zu.

Liste der Dateien

relativer Pfad nach http://www.unicode.org/Public/ Inhalt
UNIDATA/UCD.html Beschreibung des Formates der Datei UnicodeData.txt im gleichen Verzeichnis.
UNIDATA/UnicodeData.txt Liste alle Unicode-Zeichen und ihrer Eigenschaften in einem maschinell wie (mit Mühe auch) menschlich lesbaren Format; kann als Eingabe für Code-Konvertierungsprogramme oder mit einem guten Editor als Nachschlagewerk benutzt werden. Die genaue Beschreibung findet sich in der dazugehörigen WWW-Seite.
MAPPINGS/ISO8859/8859-1.TXT westeuropäisch[1] Abbildung zwischen den Codes ISO 8859-x und Unicode. Der Code ISO 8859-1 ist der typischerweise auf Unix- und Windows-, nicht jedoch MS-DOS-Systemen verwendete Zeichencode. Bei den lateinischen Schriften gibt die Zahl in eckigen Klammern die Nummer der Variante an, z.B. ISO 8859-9 = Latin5.
MAPPINGS/ISO8859/8859-2.TXT osteuropäisch[2]
MAPPINGS/ISO8859/8859-3.TXT maltesisch[3]
MAPPINGS/ISO8859/8859-4.TXT nordeuropäisch[4]
MAPPINGS/ISO8859/8859-5.TXT kyrillisch
MAPPINGS/ISO8859/8859-6.TXT arabisch
MAPPINGS/ISO8859/8859-7.TXT griechisch
MAPPINGS/ISO8859/8859-8.TXT hebräisch
MAPPINGS/ISO8859/8859-9.TXT türkisch[5]
MAPPINGS/ISO8859/8859-10.TXT nordeuropäisch[6]
MAPPINGS/ISO8859/8859-11.TXT thailändisch
MAPPINGS/ISO8859/8859-13.TXT baltisch[7]
MAPPINGS/ISO8859/8859-14.TXT keltisch[8]
MAPPINGS/ISO8859/8859-15.TXT westeur. (+ Euro)[9]
MAPPINGS/ISO8859/8859-16.TXT südosteuropäisch[10]
MAPPINGS/VENDORS/MICSFT/WINDOWS/CP1252.TXT Abbildung zwischen der Microsoft-Codepage 1252 (MS-Windows-Code ähnlich ISO 8859-1) und Unicode.
MAPPINGS/VENDORS/MICSFT/PC/CP850.TXT Abbildung zwischen der Microsoft-Codepage 850 (MS-DOS für Westeuropa) und Unicode.
MAPPINGS/VENDORS/MICSFT/MAC/ROMAN.TXT Abbildung zwischen Macintosh-Code (nur lateinische Schrift) und Unicode.
MAPPINGS/VENDORS/MISC/KOI8-R.TXT Abbildung zwischen dem Code KOI8-R (kyrillische Schrift) gemäß RFC 1489 (Codepage 878) und Unicode.
MAPPINGS/VENDORS/MICSFT/WINDOWS/CP1251.TXT Abbildung zwischen der Microsoft-Codepage 1251 (kyrillische Schrift für MS Windows) und Unicode.
MAPPINGS/VENDORS/MISC/SGML.TXT Eine große Liste von Entity-Namen für SGML und ihre Abbildung auf Unicode. Man beachte dazu, daß diese Namen nicht im eigentlichen Sinne genormt sind, sondern eher Vorschläge darstellen. Die in HTML verwendeten Entity-Namen kommen als kleine Teilmenge darin vor.