Citation Hunt

Das unten stehende Wikipedia-Snippet wird von keiner verlässlichen Quelle unterstützt. Kannst du eine finden?

Klicke auf Verstanden!, um zu Wikipedia zu gehen und das Snippet zu reparieren, oder Nächstes!, um ein anderes zu sehen. Viel Glück!

In Seite Han-Vereinheitlichung:

"

In Ostasien wird die Han-Vereinheitlichung hauptsächlich aus kulturellen, allerdings auch aus technischen Gründen kritisiert.

Historisch gab es im Chinesischen wie im Japanischen keine exakte Trennung zwischen Glyphe und Schriftzeichen. Beim Design von Unicode hatte das Konsortium die Wahl, entweder diese Differenzierung systematisch einzuführen oder aber vollständig darauf zu verzichten und jede Variation separat zu kodieren. Dies hätte für zahlreiche semantisch identische Zeichen zu zahlreichen Varianten geführt, insbesondere auch zu Varianten, die sich nicht eindeutig am Sprachraum (klassisches Chinesisch, vereinfachtes Chinesisch, Japanisch, Koreanisch), sondern nur historisch abgrenzen lassen.

Der heutige Unicode-Standard stellt einen Kompromiss dar. Auf eine vollständige Vereinheitlichung lediglich nach semantischen Kriterien wurde verzichtet. Dies hatte praktische Gründe. Es war erklärtes Ziel, dass sich modernes Chinesisch, Japanisch und Koreanisch im selben Text ohne Fontwechsel differenzieren lassen. Auch klassische Texte können in Unicode 3.1 semantisch eindeutig abgebildet werden. Lediglich die Darstellung historischer Variationen, die im linguistischen Kontext interessant sein können, ist in Unicode 3.1 nicht möglich.

Ein weiteres Problem war die fehlende Möglichkeit, in einem Text ohne Markup verschiedene Varianten eines Zeichens anzugeben. Besonders im Japanischen, wo einige Ortsbezeichnungen und Namen immer noch die alten Radikale benutzen, führt das zu Problemen. So wird beispielsweise das erste Zeichen des Ortsteils Gion 祇園 von Kyōto nicht mit geschrieben, sondern mit , obwohl andere Wörter mit mit dem -Radikal geschrieben werden.

Unicode 3.2 adressierte dieses Problem mit Variantenselektoren. Standardisierte Varianten und historisch verwendete Formen und Zeichen wurden und werden beständig hinzugefügt, so im Unicodeblock Vereinheitlichte CJK-Ideogramme, Erweiterung A (Unicode 3.0), Unicodeblock Vereinheitlichte CJK-Ideogramme, Erweiterung B (Unicode 3.1), Unicodeblock Vereinheitlichte CJK-Ideogramme, Erweiterung C (Unicode 5.2), Unicodeblock Vereinheitlichte CJK-Ideogramme, Erweiterung D (Unicode 6.0), Unicodeblock Vereinheitlichte CJK-Ideogramme, Erweiterung E (Unicode 8.0) sowie Unicodeblock Vereinheitlichte CJK-Ideogramme, Erweiterung F (Unicode 10.0).