zurück zur Startseite
  


Zurück XHTMLforum > (X)HTML und CSS > Knowledge Base
Seite neu laden Merkzettel: Charset, Encoding und Unicode verstehen und anwenden

Antwort
 
LinkBack Themen-Optionen Ansicht
  #1 (permalink)  
Alt 28.06.2007, 11:24
Benutzerbild von Loïs Bégué
Erfahrener Benutzer
XHTMLforum-Mitglied
Thread-Ersteller
 
Registriert seit: 24.06.2007
Ort: Freiburg (D)
Beiträge: 781
Loïs Bégué wird schon bald berühmt werden
Standard Merkzettel: Charset, Encoding und Unicode verstehen und anwenden

Erste Anlaufstellen:

"Tutorial: Character sets & encodings in XHTML, HTML and CSS" !!!!!
W3C I18N Tutorial: Character sets & encodings in XHTML, HTML and CSS
(Überschriften sind im Menü Links)

"Internationalization Best Practices: Character and Encoding in XHTML & HTML Content"
Authoring Techniques for XHTML & HTML Internationalization: Characters and Encodings 1.0 -- (Editors' copy)

"IANA charset registry:"
http://www.iana.org/assignments/character-sets
(alle Charsets inkl. Beschreibung)

"Unicode Character Code Charts By Script"
Code Charts - Scripts


Zur Erinnerung:

In (West-)Europa sollte "ISO8859-15" (neu) gegenüber "ISO8859-1" (alt) den Vorzug gegeben werden.
Unter anderem wegen dem Zeichen.
__________________
To attain knowledge, add things everyday. To obtain wisdom, remove things everyday. (Lao Tzu)
Links : Some needfull links (Delphi, XHTML...)
Tools : Arpoon Freeware (Checksum...)
Mit Zitat antworten
Sponsored Links
  #2 (permalink)  
Alt 28.06.2007, 12:53
Benutzerbild von Gumbo
XHTMLforum-Kenner
 
Registriert seit: 22.08.2004
Ort: Trier
Beiträge: 2.740
Gumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekannt
Standard

Ich ziehe Unicode allen anderen Zeichensätzen vor, vor allem, weil dieser sämtliche sinntragenden Zeichen enthält.
__________________
Markus Wulftange
Mit Zitat antworten
Sponsored Links
  #3 (permalink)  
Alt 28.06.2007, 15:04
Benutzerbild von Loïs Bégué
Erfahrener Benutzer
XHTMLforum-Mitglied
Thread-Ersteller
 
Registriert seit: 24.06.2007
Ort: Freiburg (D)
Beiträge: 781
Loïs Bégué wird schon bald berühmt werden
Standard Fast...

Zitat:
Zitat von Gumbo Beitrag anzeigen
Ich ziehe Unicode allen anderen Zeichensätzen vor, vor allem, weil dieser sämtliche sinntragenden Zeichen enthält.
Fast: Unicode ist kein Zeichensatz sondern ein Kodierungssystem

Siehe mein Beitrag:
Merkzettel: Unicode Überblick

Gruß,
Loïs
__________________
To attain knowledge, add things everyday. To obtain wisdom, remove things everyday. (Lao Tzu)
Links : Some needfull links (Delphi, XHTML...)
Tools : Arpoon Freeware (Checksum...)
Mit Zitat antworten
  #4 (permalink)  
Alt 28.06.2007, 16:06
Benutzerbild von inta
free as in freedom
XHTMLforum-Kenner
 
Registriert seit: 04.12.2006
Ort: Berlin
Beiträge: 5.011
inta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz sein
Standard

Unicode entspricht durchaus einem Zeichensatz (bezeichnet aber auch den Standard), eine zugehörige Kodierung ist z.B. UTF.
Mit Zitat antworten
  #5 (permalink)  
Alt 28.06.2007, 16:51
Benutzerbild von Loïs Bégué
Erfahrener Benutzer
XHTMLforum-Mitglied
Thread-Ersteller
 
Registriert seit: 24.06.2007
Ort: Freiburg (D)
Beiträge: 781
Loïs Bégué wird schon bald berühmt werden
Standard

Zitat:
Zitat von inta Beitrag anzeigen
Unicode entspricht durchaus einem Zeichensatz (bezeichnet aber auch den Standard), eine zugehörige Kodierung ist z.B. UTF.
Unicode entspricht einem Zeichensatz ???

Definitiv und unwiderruflich nein!
  1. dieser "Unicode Zeichensatz" würde ALLEN möglichen Zeichen aller Zeiten, Länder und Platformen beinhalten. Was aber klar gegen die "Blöcke" bzw. die Idee und die Definition von "Satz" sprechen würde.
  2. UTF-8 ist eine Kodierung der Unicode Zeichenliste, die wiederum ALLE Zeichen beinhaltet (zumindest in der Theorie, da die Inventarisierung noch nicht ganz abgeschlossen ist).


Ich gebe zu, diese Unterschiede sind nicht ganz trivial und die Begriffe werden oft missbräulich verwendet

IMHO ist es aber besser die Sache richtig zu stellen und damit zu verhindern, dass Missverständnisse wie diese weiterhin bestehen.

Wie gesagt: siehe den Merkzettel zu Unicode...

Gruß,
Loïs
__________________
To attain knowledge, add things everyday. To obtain wisdom, remove things everyday. (Lao Tzu)
Links : Some needfull links (Delphi, XHTML...)
Tools : Arpoon Freeware (Checksum...)
Mit Zitat antworten
  #6 (permalink)  
Alt 28.06.2007, 17:11
Benutzerbild von inta
free as in freedom
XHTMLforum-Kenner
 
Registriert seit: 04.12.2006
Ort: Berlin
Beiträge: 5.011
inta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz sein
Standard

Als Zeichensatz bezeichnet man einen gewissen Vorrat an Zeichen die zur Verfügung stehen um irgendetwas darzustellen.
Oder wie es in der Wikipedia ausgedrückt wird:
Zitat:
In der Computertechnik versteht man unter einem Zeichensatz die Zuordnung der alphanumerischen Zeichen zu einer Zahl.
Demnach ist Unicode sehr wohl ein Zeichensatz, auch wenn er sich technisch von anderen Zeichensätzen unterscheidet. Alle anderen Bezeichnungen führen nur zu noch mehr Verwirrung als eh schon herrscht. Zeichensatz ist an dieser Stelle definitiv nicht falsch.

Es reicht aus zwischen "Zeichensatz" (z.B. Unicode) und "Zeichenkodierung" (z.B. UTF-8 ) zu unterscheiden.
Mit Zitat antworten
  #7 (permalink)  
Alt 28.06.2007, 19:33
Benutzerbild von Gumbo
XHTMLforum-Kenner
 
Registriert seit: 22.08.2004
Ort: Trier
Beiträge: 2.740
Gumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekannt
Standard

Zitat:
Zitat von Loïs Bégué Beitrag anzeigen
Fast: Unicode ist kein Zeichensatz sondern ein Kodierungssystem

Siehe mein Beitrag:
Merkzettel: Unicode Überblick

Gruß,
Loïs
Um genau zu sein ist Unicode nur ein Standard zur Entwicklung eines allgemeingültigen und allumfassenden Zeichensatzes. „Unicode gibt jedem Zeichen seine eigene Nummer“, lautet es auf Unicode.org, was genau der Definition eines Zeichensatzes entspricht: die eindeutige Zuordnung der verfügbaren Zeichens (des Zeichenvorrats) zu einer Nummer. Daher ist es durchaus legitim, Unicode einen Zeichensatz zu nennen.


Von deinem Unicode-Merkzettel halte ich allerdings nicht viel. Ich bin eher der Meinung, dass damit mehr Missverständnisse aufkommen als geklärt werden. So ist UTF-8 beispielsweise eine Kodierung und kann somit auch keine Zeichen enthalten (ein Zeichensatz dagegen schon), sondern nur kodieren. Die Tatsache, dass der Unicode-Zeichensatz in Blöcke unterteilt ist, ist eher eine unnötige Zusatzinformation, die im täglichen Umgang mit Unicode nicht hilfreich ist. Und der Unterschied zwischen Zeichensatz und Schriftsystem – ganz zu schweigen von der mir wichtigeren aber fehlenden Unterscheidung von Zeichensatz und Zeichenkodierung – ist auch eher verwirrend als aufschlussreich.

Als Merkzettel ist es in meinen Augen daher nicht sehr hilfreich. Da empfehle ich lieber Michael Jendryschiks „Zeichenkodierung – Einführung in XHTML, CSS und Webdesign“.
__________________
Markus Wulftange
Mit Zitat antworten
  #8 (permalink)  
Alt 29.06.2007, 11:19
Benutzerbild von Loïs Bégué
Erfahrener Benutzer
XHTMLforum-Mitglied
Thread-Ersteller
 
Registriert seit: 24.06.2007
Ort: Freiburg (D)
Beiträge: 781
Loïs Bégué wird schon bald berühmt werden
Standard

Zitat:
Zitat von inta Beitrag anzeigen
Als Zeichensatz bezeichnet man einen gewissen Vorrat an Zeichen die zur Verfügung stehen um irgendetwas darzustellen.
Oder wie es in der Wikipedia ausgedrückt wird:


Demnach ist Unicode sehr wohl ein Zeichensatz, auch wenn er sich technisch von anderen Zeichensätzen unterscheidet. Alle anderen Bezeichnungen führen nur zu noch mehr Verwirrung als eh schon herrscht. Zeichensatz ist an dieser Stelle definitiv nicht falsch.

Es reicht aus zwischen "Zeichensatz" (z.B. Unicode) und "Zeichenkodierung" (z.B. UTF-8 ) zu unterscheiden.
Die Etymologie von "Satz" führt zu "Gruppe" bzw. "(An-)Teil".
"(An-)Teil" bzw. "Satz" werden eher selten angewendet, um das "Ganze" zu beschreiben.

"Unicode" ist per Definition das "Ganze".
"Zeichensatz" ist ein "(An-)Teil".

Mag sein, dass im weitesten Sinne bzw. in der Umgangssprache etwas anderes gilt.... Aber wie unterscheidet man dann zwischen "Ganze" und "(An-)Teil" ?
__________________
To attain knowledge, add things everyday. To obtain wisdom, remove things everyday. (Lao Tzu)
Links : Some needfull links (Delphi, XHTML...)
Tools : Arpoon Freeware (Checksum...)

Geändert von Loïs Bégué (29.06.2007 um 11:22 Uhr)
Mit Zitat antworten
  #9 (permalink)  
Alt 29.06.2007, 11:26
Benutzerbild von Loïs Bégué
Erfahrener Benutzer
XHTMLforum-Mitglied
Thread-Ersteller
 
Registriert seit: 24.06.2007
Ort: Freiburg (D)
Beiträge: 781
Loïs Bégué wird schon bald berühmt werden
Standard

@inta:

Die zitierte Wiki-Definition ist eindeutig FALSCH.

Ein Zeichensatz ist eine AUSWAHL an alphanumerischen Zeichen.

Ein Zeichensystem oder Kodierungsystem (bzw. Zeichenkodierung im weitesten Sinne - leider missverständlich) ist eine Zuordnung Zeichen-Code.

Eine Zeichenkodierung (im engeren Sinne) beschreibt die Speicherungsform des Codes.

Leider steht im Wikipedia nicht immer Sinnvolles...

Gruß,
Loïs
__________________
To attain knowledge, add things everyday. To obtain wisdom, remove things everyday. (Lao Tzu)
Links : Some needfull links (Delphi, XHTML...)
Tools : Arpoon Freeware (Checksum...)

Geändert von Loïs Bégué (29.06.2007 um 11:43 Uhr)
Mit Zitat antworten
Sponsored Links
  #10 (permalink)  
Alt 29.06.2007, 12:05
Benutzerbild von inta
free as in freedom
XHTMLforum-Kenner
 
Registriert seit: 04.12.2006
Ort: Berlin
Beiträge: 5.011
inta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz sein
Standard

Dann gibt es hier eine weiter Quelle dazu:
Zeichensatz :: Definition :: IT-Lexikon

Zitat:
Unicode provides a unique number for every character
Dies stammt von unicode.org und entspricht der Definition eines Zeichensatzes.
Unicode ist ein Standard und damit auf jeden Fall mehr als nur ein Zeichensatz, trotzdem beinhaltet es eben diesen.

Führ doch bitte ein paar Quellen an, durch bloße Behauptungen lasse ich mich nicht überzeugen.
Mit Zitat antworten
Sponsored Links
Antwort

Themen-Optionen
Ansicht

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus


Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Merkzettel: Unicode Überblick Loïs Bégué Knowledge Base 8 02.07.2007 22:46
No encoding declaration was found in the 'charset' parameter hyperterminal (X)HTML 6 03.02.2005 19:47


Alle Zeitangaben in WEZ +2. Es ist jetzt 18:34 Uhr.