Merkzettel: Charset, Encoding und Unicode verstehen und anwenden
Erste Anlaufstellen:
"Tutorial: Character sets & encodings in XHTML, HTML and CSS" !!!!! W3C I18N Tutorial: Character sets & encodings in XHTML, HTML and CSS (Überschriften sind im Menü Links) "Internationalization Best Practices: Character and Encoding in XHTML & HTML Content" Authoring Techniques for XHTML & HTML Internationalization: Characters and Encodings 1.0 -- (Editors' copy) "IANA charset registry:" http://www.iana.org/assignments/character-sets (alle Charsets inkl. Beschreibung) "Unicode Character Code Charts By Script" Code Charts - Scripts Zur Erinnerung: In (West-)Europa sollte "ISO8859-15" (neu) gegenüber "ISO8859-1" (alt) den Vorzug gegeben werden. Unter anderem wegen dem € Zeichen. |
Ich ziehe Unicode allen anderen Zeichensätzen vor, vor allem, weil dieser sämtliche sinntragenden Zeichen enthält.
|
Fast...
Zitat:
Siehe mein Beitrag: Merkzettel: Unicode Überblick Gruß, Loïs |
Unicode entspricht durchaus einem Zeichensatz (bezeichnet aber auch den Standard), eine zugehörige Kodierung ist z.B. UTF.
|
Zitat:
Definitiv und unwiderruflich nein!
Ich gebe zu, diese Unterschiede sind nicht ganz trivial und die Begriffe werden oft missbräulich verwendet :? IMHO ist es aber besser die Sache richtig zu stellen und damit zu verhindern, dass Missverständnisse wie diese weiterhin bestehen. Wie gesagt: siehe den Merkzettel zu Unicode... Gruß, Loïs |
Als Zeichensatz bezeichnet man einen gewissen Vorrat an Zeichen die zur Verfügung stehen um irgendetwas darzustellen.
Oder wie es in der Wikipedia ausgedrückt wird: Zitat:
Es reicht aus zwischen "Zeichensatz" (z.B. Unicode) und "Zeichenkodierung" (z.B. UTF-8 ) zu unterscheiden. |
Zitat:
Von deinem Unicode-Merkzettel halte ich allerdings nicht viel. Ich bin eher der Meinung, dass damit mehr Missverständnisse aufkommen als geklärt werden. So ist UTF-8 beispielsweise eine Kodierung und kann somit auch keine Zeichen enthalten (ein Zeichensatz dagegen schon), sondern nur kodieren. Die Tatsache, dass der Unicode-Zeichensatz in Blöcke unterteilt ist, ist eher eine unnötige Zusatzinformation, die im täglichen Umgang mit Unicode nicht hilfreich ist. Und der Unterschied zwischen Zeichensatz und Schriftsystem – ganz zu schweigen von der mir wichtigeren aber fehlenden Unterscheidung von Zeichensatz und Zeichenkodierung – ist auch eher verwirrend als aufschlussreich. Als Merkzettel ist es in meinen Augen daher nicht sehr hilfreich. Da empfehle ich lieber Michael Jendryschiks „Zeichenkodierung – Einführung in XHTML, CSS und Webdesign“. |
Zitat:
"(An-)Teil" bzw. "Satz" werden eher selten angewendet, um das "Ganze" zu beschreiben. "Unicode" ist per Definition das "Ganze". "Zeichensatz" ist ein "(An-)Teil". Mag sein, dass im weitesten Sinne bzw. in der Umgangssprache etwas anderes gilt.... Aber wie unterscheidet man dann zwischen "Ganze" und "(An-)Teil" ? |
@inta:
Die zitierte Wiki-Definition ist eindeutig FALSCH. Ein Zeichensatz ist eine AUSWAHL an alphanumerischen Zeichen. Ein Zeichensystem oder Kodierungsystem (bzw. Zeichenkodierung im weitesten Sinne - leider missverständlich) ist eine Zuordnung Zeichen-Code. Eine Zeichenkodierung (im engeren Sinne) beschreibt die Speicherungsform des Codes. Leider steht im Wikipedia nicht immer Sinnvolles... Gruß, Loïs |
Dann gibt es hier eine weiter Quelle dazu:
Zeichensatz :: Definition :: IT-Lexikon Zitat:
Unicode ist ein Standard und damit auf jeden Fall mehr als nur ein Zeichensatz, trotzdem beinhaltet es eben diesen. Führ doch bitte ein paar Quellen an, durch bloße Behauptungen lasse ich mich nicht überzeugen. |
Alle Zeitangaben in WEZ +2. Es ist jetzt 03:01 Uhr. |
Powered by vBulletin® Version 3.8.11 (Deutsch)
Copyright ©2000 - 2024, vBulletin Solutions, Inc.
© Dirk H. 2003 - 2023