zurück zur Startseite
  


Zurück XHTMLforum > (X)HTML und CSS > Knowledge Base
Seite neu laden Merkzettel: Charset, Encoding und Unicode verstehen und anwenden

Antwort
 
LinkBack Themen-Optionen Ansicht
  #11 (permalink)  
Alt 29.06.2007, 13:00
Benutzerbild von Loïs Bégué
Erfahrener Benutzer
XHTMLforum-Mitglied
Thread-Ersteller
 
Registriert seit: 24.06.2007
Ort: Freiburg (D)
Beiträge: 781
Loïs Bégué wird schon bald berühmt werden
Standard

Zitat:
Zitat von inta Beitrag anzeigen
Dann gibt es hier eine weiter Quelle dazu:
Zeichensatz :: Definition :: IT-Lexikon

Dies stammt von unicode.org und entspricht der Definition eines Zeichensatzes.
Unicode ist ein Standard und damit auf jeden Fall mehr als nur ein Zeichensatz, trotzdem beinhaltet es eben diesen.

Führ doch bitte ein paar Quellen an, durch bloße Behauptungen lasse ich mich nicht überzeugen.
Du musst nicht unbedingt das Gleiche (in englisch) zitieren wie ich
Vergessen hast Du aber:
Zitat:
...no matter what the platform, no matter what the program, no matter what the language.
was sinngemäß für "ALLE Zeichen allerorts allerzeits..." steht = "Das Ganze".

Es wäre schön gewesen, wenn Du den Text Deiner Quelle (IT-Lexikon) durchgelesen hättest.
Dort zählt Unicode nicht zu den Zeichensätze.
Und: "Satz" wir vom "IT-Lexicon" als "Vorrat" bezeichnet.
Richtig ! Es ist ein Anteil und nicht "das Ganze".

Auf Deine Bitte um Quellen gehe ich gerne ein:
  1. Etymologie - Wikipedia
    Dort steht sinngemäß: "echte Bedeutung eines Wortes".
    .
  2. UNICODE.ORG - The Character Encoding Model
    The four levels of the Unicode Character Encoding Model can be summarized as:
    • ACR: Abstract Character Repertoire
      the set of characters to be encoded, for example, some alphabet or symbol set. The word abstract means that these objects are defined by convention. In many cases a repertoire consists of a familiar alphabet or symbol set.
    • CCS: Coded Character Set
      a mapping from an abstract character repertoire to a set of nonnegative integers
    • CEF: Character Encoding Form
      a mapping from a set of nonnegative integers that are elements of a CCS to a set of sequences of particular code units of some specified width, such as 32-bit integers
    • CES: Character Encoding Scheme
      a reversible transformation from a set of sequences of code units (from one or more CEFs to a serialized sequence of bytes
    In addition to the four individual levels, there are two other useful concepts:
    • CM: Character Map
      a mapping from sequences of members of an abstract character repertoire to serialized sequences of bytes bridging all four levels in a single operation.
    • TES: Transfer Encoding Syntax
      a reversible transform of encoded data. This data may or may not contain textual data
  3. UNICODE.ORG - Coded Character Set (CCS)
    A coded character set is defined to be a mapping from a set of abstract characters to the set of nonnegative integers. This range of integers need not be contiguous.

Beachte den Gebrauch von:
- "...Repertoire..."
- "...some alphabet..."
- "...a set of..."


Schematisch:
Zitat:
Für jedes Zeichen Element von "Alle Zeichen der Welt" existiert Charactercode = f(Zeichen).
Zeichensatz = CS = Character_1 + ... + Character_n und [1..n] = Untermenge von "Alle Zeichen der Welt".
Kodiertes CS = CCS = f(Character_1) + ... + f(Character_n), Character_x Element des gegebenen CS
Unicode = Summe ( CCS_1 + CCS_2 + ... + CCS_n )
Unicode kann also nicht gleich CS sein.
Q.E.D.

@inta: Ich hoffe, ich konnte Dir helfen, alle Unverständnisse endgültig zu klären.
__________________
To attain knowledge, add things everyday. To obtain wisdom, remove things everyday. (Lao Tzu)
Links : Some needfull links (Delphi, XHTML...)
Tools : Arpoon Freeware (Checksum...)

Geändert von Loïs Bégué (29.06.2007 um 14:08 Uhr)
Mit Zitat antworten
Sponsored Links
  #12 (permalink)  
Alt 29.06.2007, 13:54
Benutzerbild von Gumbo
XHTMLforum-Kenner
 
Registriert seit: 22.08.2004
Ort: Trier
Beiträge: 2.741
Gumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekannt
Standard

Nachfolgend meine Definitionen der Begriffe:
  • Zeichenvorrat: Menge der zur Verfügung stehenden Zeichen.
    Dies überschneidet sich mit der Definition des im Unicode definierten Begriffs Abstract Character Repertoire:
    die Menge der zu kodierenden Zeichen, beispielsweise ein Alphabet oder eine Menge von Symbolen. Das Wort abstrakt bedeutet, dass diese Objekte durch ein Abkommen definiert sind. In vielen Fällen besteht dieser Vorrat aus einem bekannten Alphabet oder einer Symbolmenge.
    *
  • Zeichensatz: Abbildung des Zeichenvorrats auf eine nicht-negative Menge von Ganzzahlen.
    Dies überschneidet sich mit der Definition des im Unicode definierten Begriffs Coded Character Set:
    eine Abbildungsform des abstrakten Zeichenvorrats auf eine Menge nicht-negativer Ganzzahlen
    *
  • Zeichenkodierung: Abbildung der nicht-negativen Menge von Ganzzahlen des Zeichensatzes auf die Menge von Bitsequenzen.
    Dies überschneidet sich mit der Definition des im Unicode definierten Begriffs Character Encoding Form:
    ein Abbildungsformat der nicht-negativen Ganzzahlen, die Element eines Zeichensatzes sind, auf die Menge der Sequenzen einer bestimmten Codeeinheit einer bestimmten Länge, wie etwa einer 32-Bit-Ganzzahl

Aufgrund dessen sehe ich nicht, dass sich meine Auffassung dieser Begriffe von denen des Unicode-Standards unterscheiden.
__________________
Markus Wulftange
Mit Zitat antworten
Sponsored Links
  #13 (permalink)  
Alt 29.06.2007, 14:32
Benutzerbild von Loïs Bégué
Erfahrener Benutzer
XHTMLforum-Mitglied
Thread-Ersteller
 
Registriert seit: 24.06.2007
Ort: Freiburg (D)
Beiträge: 781
Loïs Bégué wird schon bald berühmt werden
Standard

Zitat:
Zitat von Gumbo Beitrag anzeigen
...
Aufgrund dessen sehe ich nicht, dass sich meine Auffassung dieser Begriffe von denen des Unicode-Standards unterscheiden.
Tun Sie ja nicht. Alle 3 sind ja von Unicode.org selbst und somit auch richtig.

(( Übersetzungfehler:
Es heißt nicht "Zeichenvorrat = Menge der zur Verfügung stehenden Zeichen" sonder "Menge von zur Verfügung stehenden Zeichen". ))


Es ist so, dass:
Unicode (i.e.S.) = Alle solchermaßen definierten Zeichensätze...
Unicode (i.w.S.) = ...unter Verwendung von einer festzulegenden Zeichenkodierung

Allerletzter Hinweis
Wenn Du einen der "freien Codepoints" für Dein eigenes, selbstdefiniertes, selbst kreiertes Zeichen benützt, dann kreierst Du ein Zeichensatz.
Das gilt aber genauso für mich und für allen anderen, die den gleichen Codepoint für eigene Zwecke benutzen: wir kreieren alle einen einmaligen Zeichensatz.
Und es ist Bestandteil von Unicode. Ganz offiziell.
Folgerung:
Unicode kann nicht ein Zeichensatz sein.
Es ist nämlich die Summe von mehrere (Deins, Meins... Unseren), die sich zum Teil sogar überlagern.
__________________
To attain knowledge, add things everyday. To obtain wisdom, remove things everyday. (Lao Tzu)
Links : Some needfull links (Delphi, XHTML...)
Tools : Arpoon Freeware (Checksum...)
Mit Zitat antworten
  #14 (permalink)  
Alt 29.06.2007, 15:14
Benutzerbild von inta
free as in freedom
XHTMLforum-Kenner
 
Registriert seit: 04.12.2006
Ort: Berlin
Beiträge: 5.011
inta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz sein
Standard

Dann lass deine eigene Kreation weg und du hast den Standard-Unicodezeichensatz. Ist das denn so schwer zu verstehen, dass dieses Wort sowohl den gesamten Standard bezeichnet also auch den Zeichensatz der aus diesem Standard hervorgeht?

Was du machst ist unnötig kompliziert. Wahrscheinlich möchte niemand den Standard auswendig lernen, sondern lediglich den Zeichensatz und die Kodierung verwenden.
Mit Zitat antworten
  #15 (permalink)  
Alt 30.06.2007, 00:36
Benutzerbild von ArcVieh
//
XHTMLforum-Kenner
 
Registriert seit: 19.12.2006
Ort: Gütersloh
Beiträge: 1.850
ArcVieh sorgt für eine eindrucksvolle AtmosphäreArcVieh sorgt für eine eindrucksvolle Atmosphäre
Standard

Zitat:
Zitat von inta Beitrag anzeigen
Was du machst ist unnötig kompliziert. Wahrscheinlich möchte niemand den Standard auswendig lernen, sondern lediglich den Zeichensatz und die Kodierung verwenden.
Bingo!
Vorallem, was hätte man davon?
Das einzige Thema von Loïs Bégué scheint die Zeichenkodierung zu sein. Aber was solls, verwirren wir die Leute die mit der Zeichenkodierung erst recht nicht klar kommen noch ein bisschen mehr...
Mit Zitat antworten
  #16 (permalink)  
Alt 30.06.2007, 10:25
Benutzerbild von Loïs Bégué
Erfahrener Benutzer
XHTMLforum-Mitglied
Thread-Ersteller
 
Registriert seit: 24.06.2007
Ort: Freiburg (D)
Beiträge: 781
Loïs Bégué wird schon bald berühmt werden
Standard

Zitat:
Zitat von inta Beitrag anzeigen
Dann lass deine eigene Kreation weg und du hast den Standard-Unicodezeichensatz. Ist das denn so schwer zu verstehen, dass dieses Wort sowohl den gesamten Standard bezeichnet also auch den Zeichensatz der aus diesem Standard hervorgeht?
Ich gebe Dir 100%ig Recht:
es ist unglaublich schwer zu verstehen...

Ich gebe Dir 100%ig Recht:
Ich lag falsch in der Annahme, Du würdest Dich für die Fakten interessieren.

Denn, es gibt KEIN "Standard-Unicodezeichensatz". Basta.

Zitat:
Zitat von inta Beitrag anzeigen
Was du machst ist unnötig kompliziert. Wahrscheinlich möchte niemand den Standard auswendig lernen, sondern lediglich den Zeichensatz und die Kodierung verwenden.
Bist Du so von Dir überzeugt, dass Du jetzt auch noch "flamen" musst?
- Ich "mache" gar nichts. Ich habe "hingewiesen und zitiert".
- Ja, etwas kompliziert sind die Fakten/Tatsachen zu Charsets, Unicode und Ähnliches allemal.
- es gibt nichts auswendig zu lernen: es gibt nur 1 einziges Prinzip zu verstehen.

Ich wollte Dich nicht überfordern. Sorry.
__________________
To attain knowledge, add things everyday. To obtain wisdom, remove things everyday. (Lao Tzu)
Links : Some needfull links (Delphi, XHTML...)
Tools : Arpoon Freeware (Checksum...)
Mit Zitat antworten
  #17 (permalink)  
Alt 30.06.2007, 10:38
Benutzerbild von Loïs Bégué
Erfahrener Benutzer
XHTMLforum-Mitglied
Thread-Ersteller
 
Registriert seit: 24.06.2007
Ort: Freiburg (D)
Beiträge: 781
Loïs Bégué wird schon bald berühmt werden
Standard

Danke ArcVieh !

Zitat:
Zitat von ArcVieh Beitrag anzeigen
Bingo!
Vorallem, was hätte man davon?
Hmmmm...
Etwas ausnahmsweise richtig zu verstehen?

Zitat:
Zitat von ArcVieh Beitrag anzeigen
Das einzige Thema von Loïs Bégué scheint die Zeichenkodierung zu sein. Aber was solls, verwirren wir die Leute die mit der Zeichenkodierung erst recht nicht klar kommen noch ein bisschen mehr...
Es ist arg fies und ungerecht:
Du besitzt Super Fähigkeiten - Du weist besser als ich worum es mir geht.
Besser gesagt: "ging". Denn...

Mein größter Fehler?
Ich dachte, dass Aufklärung eine gute Sache sei.
Danke ArcVieh !!! Du hast mir gezeigt, dass ich, was dies betrifft, vollkommen falsch liege.

Und ich dachte schon, (mit meiner fünf Jahre Erfahrung als Forum-Moderator) würde mir sowas nicht mehr passieren... Tss, tss, tss.
Man lernt ja nie aus
__________________
To attain knowledge, add things everyday. To obtain wisdom, remove things everyday. (Lao Tzu)
Links : Some needfull links (Delphi, XHTML...)
Tools : Arpoon Freeware (Checksum...)

Geändert von Loïs Bégué (30.06.2007 um 11:00 Uhr)
Mit Zitat antworten
  #18 (permalink)  
Alt 30.06.2007, 22:59
Benutzerbild von ArcVieh
//
XHTMLforum-Kenner
 
Registriert seit: 19.12.2006
Ort: Gütersloh
Beiträge: 1.850
ArcVieh sorgt für eine eindrucksvolle AtmosphäreArcVieh sorgt für eine eindrucksvolle Atmosphäre
Standard

Eine deiner weiteren Fähigkeiten scheint es zu sein, Aussagen in den falschen Hals zu bekommen. Vieles was ich mir von dir durchgelesen habe, fand ich durchaus interessant, aber Du legst es in anderen Themen immer wieder darauf an, auf Zeichenkodierungen zu verweisen.

Ich wollte dir bei weitem nicht gegen den Kopf stoßen, tut mir leid wenn ich das ausgelößt haben sollte.

PS: Durchaus, Aufklärung ist eine gute Sache, aber wiederum ist es eine andere Sache, ob die Aufklärung exakt in gut gewählten Wörtern geschieht, oder durchs hinklatschen einer wahren Informationsflut.

Edit: Dieses Thread eignet sich aber durchaus zum verlinken für Leute, die Informationen suchen.

Geändert von ArcVieh (30.06.2007 um 23:02 Uhr)
Mit Zitat antworten
  #19 (permalink)  
Alt 02.07.2007, 11:39
Benutzerbild von inta
free as in freedom
XHTMLforum-Kenner
 
Registriert seit: 04.12.2006
Ort: Berlin
Beiträge: 5.011
inta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz seininta kann auf vieles stolz sein
Standard

@Loïs
Ich weiß ehrlich nicht wieso du dich so aufregst. Der einzige der hier permanent den Leuten die Worte im Mund herumdreht und Unterstellungen macht bist du.
Dein technisches Verständnis in allen Ehren, aber du machst es einem wirklich nicht leicht über etwas zu diskutieren. In vielen Punkten hast du durchaus recht, aber meiner Meinung nach nicht in allen.


Ich möchte den hervorragenden Links hier noch einen weiteren hinzufügen, der den Sachverhalt ganz gut erklärt:
Alles über Unicode
Mit Zitat antworten
Sponsored Links
  #20 (permalink)  
Alt 02.07.2007, 13:07
Benutzerbild von Loïs Bégué
Erfahrener Benutzer
XHTMLforum-Mitglied
Thread-Ersteller
 
Registriert seit: 24.06.2007
Ort: Freiburg (D)
Beiträge: 781
Loïs Bégué wird schon bald berühmt werden
Standard

@ArcVieh:
Nullo problemo:
Zusammenarbeiten macht Spaß... u.a. deshalb, weil man sich manchmal "konstruktiv austauschen" darf und weil es nichts zu gewinnen gibt, außer die Zufriedenheit, dass man jeweils das Beste von sich gegeben hat.
Trifft hier meines E. für uns beide hier auch zu

@inta:
Wie bereits gesagt: ich will nicht mehr auf Worte wie "ehrlich", "Unterstellung", "in allen Ehren" reagieren. Ist alles langweilig... und destruktiv.

Deshalb: direkt zur Sache !

Der Link schien auf dem ertsen Blick ganz ok zu sein...
Er ist es aber leider überhaupt nicht:
  1. unicode ist nicht "ein von der internationalen Standardisierungs-Organisation ISO genormtes System"
  2. unicode ist nicht nur "zur Kodierung von Textzeichen" sondern auch (unter anderem) von Steuerzeichen, Zeichen-Positionierung (u.a. left-to-right und umgekehrt...), Collation-Schemen (zur Sortierung/Indexierung), Zeichen-Benennung (Name Uniqueness...wie z.B. "I = LATIN CAPITAL LETTER I...") und auch deswegen kein Zeichensatz.
  3. "in einem Zeichensatz zusammenzufassen" müsste zum Beispiel "in einem systematischen Register..." heißen.
  4. "Engl.: Character Encoding Scheme; CES" läßt sich nicht mit "Zeichensatz" übersetzen.
  5. "Zeichensätze sind ... die einem Textzeichen einen Byte-Wert zuordnen": Upppps!

Ich habe nach 2 Absätze (von 16) aufgehört, die Fehler aufzulisten...

Fazit:
- Unicode ist kein Zeichensatz. Es ist ein System, dass sich mit Zeichensätze befasst.
- Die per Link angegebene Quelle enthält (am heutigen Tag: 2007/07/02) so viele Fehler, dass sie unbrauchbar ist.

Gruß,
Loïs

p.s.: Zu 1):
Zitat:
The Unicode Consortium is a non-profit organization...
The Consortium cooperates with W3C and ISO...
siehe auch Unicode Members-Logo Version
__________________
To attain knowledge, add things everyday. To obtain wisdom, remove things everyday. (Lao Tzu)
Links : Some needfull links (Delphi, XHTML...)
Tools : Arpoon Freeware (Checksum...)

Geändert von Loïs Bégué (02.07.2007 um 13:27 Uhr)
Mit Zitat antworten
Sponsored Links
Antwort

Themen-Optionen
Ansicht

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus


Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Merkzettel: Unicode Überblick Loïs Bégué Knowledge Base 8 02.07.2007 22:46
No encoding declaration was found in the 'charset' parameter hyperterminal (X)HTML 6 03.02.2005 19:47


Alle Zeitangaben in WEZ +2. Es ist jetzt 12:47 Uhr.