Zitat:
Zitat von inta
Dann gibt es hier eine weiter Quelle dazu:
Zeichensatz :: Definition :: IT-Lexikon
Dies stammt von unicode.org und entspricht der Definition eines Zeichensatzes.
Unicode ist ein Standard und damit auf jeden Fall mehr als nur ein Zeichensatz, trotzdem beinhaltet es eben diesen.
Führ doch bitte ein paar Quellen an, durch bloße Behauptungen lasse ich mich nicht überzeugen.
|
Du musst nicht unbedingt das Gleiche (in englisch) zitieren wie ich
Vergessen hast Du aber:
Zitat:
...no matter what the platform, no matter what the program, no matter what the language.
|
was sinngemäß für "ALLE Zeichen allerorts allerzeits..." steht = "Das Ganze".
Es wäre schön gewesen, wenn Du den Text
Deiner Quelle (IT-Lexikon) durchgelesen hättest.
Dort zählt Unicode nicht zu den Zeichensätze.
Und: "
Satz" wir vom "IT-Lexicon" als "Vorrat" bezeichnet.
Richtig ! Es ist ein Anteil und nicht "das Ganze".
Auf Deine Bitte um
Quellen gehe ich gerne ein:
- Etymologie - Wikipedia
Dort steht sinngemäß: "echte Bedeutung eines Wortes".
.
- UNICODE.ORG - The Character Encoding Model
The four levels of the Unicode Character Encoding Model can be summarized as:- ACR: Abstract Character Repertoire
the set of characters to be encoded, for example, some alphabet or symbol set. The word abstract means that these objects are defined by convention. In many cases a repertoire consists of a familiar alphabet or symbol set.
- CCS: Coded Character Set
a mapping from an abstract character repertoire to a set of nonnegative integers
- CEF: Character Encoding Form
a mapping from a set of nonnegative integers that are elements of a CCS to a set of sequences of particular code units of some specified width, such as 32-bit integers
- CES: Character Encoding Scheme
a reversible transformation from a set of sequences of code units (from one or more CEFs to a serialized sequence of bytes
In addition to the four individual levels, there are two other useful concepts:- CM: Character Map
a mapping from sequences of members of an abstract character repertoire to serialized sequences of bytes bridging all four levels in a single operation.
- TES: Transfer Encoding Syntax
a reversible transform of encoded data. This data may or may not contain textual data
- UNICODE.ORG - Coded Character Set (CCS)
A coded character set is defined to be a mapping from a set of abstract characters to the set of nonnegative integers. This range of integers need not be contiguous.
Beachte den Gebrauch von:
- "...Repertoire..."
- "...some alphabet..."
- "...a set of..."
Schematisch:
Zitat:
Für jedes Zeichen Element von "Alle Zeichen der Welt" existiert Charactercode = f(Zeichen).
Zeichensatz = CS = Character_1 + ... + Character_n und [1..n] = Untermenge von "Alle Zeichen der Welt".
Kodiertes CS = CCS = f(Character_1) + ... + f(Character_n), Character_x Element des gegebenen CS
Unicode = Summe ( CCS_1 + CCS_2 + ... + CCS_n )
|
Unicode kann also nicht gleich CS sein.
Q.E.D.
@inta: Ich hoffe, ich konnte Dir helfen, alle Unverständnisse endgültig zu klären.