zurück zur Startseite
  


Zurück XHTMLforum > (X)HTML und CSS > (X)HTML
Seite neu laden Welche bzw. wieviele Sprachen unterstützt UTF-8

Antwort
 
LinkBack Themen-Optionen Ansicht
  #1 (permalink)  
Alt 09.01.2008, 11:03
Neuer Benutzer
neuer user
Thread-Ersteller
 
Registriert seit: 09.01.2008
Beiträge: 4
clark befindet sich auf einem aufstrebenden Ast
Standard Welche bzw. wieviele Sprachen unterstützt UTF-8

Guten Morgen,

ich habe schon viel über UTF-8 gelesen usw. Allerdings war das alles immer sehr technisch (Bits und Bytes) und ich habe bis dato noch keine Angabe darüber gefunden, wievele Sprachen UTF-8 nun genau unterstützt. Vielleicht wisst ihr ja mehr. Danke schon mal.

Gruß,
Clark
Mit Zitat antworten
Sponsored Links
  #2 (permalink)  
Alt 09.01.2008, 11:36
Benutzerbild von Gumbo
XHTMLforum-Kenner
 
Registriert seit: 22.08.2004
Ort: Trier
Beiträge: 2.733
Gumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekannt
Standard

UTF-8 ist nur eine Zeichenkodierung des UCS, des Zeichensatzes des Unicode-Standards, für den allgemeinen Gebrauch meist einfach als Unicode bezeichnet. Mit UTF-8 werden also Unicode-Zeichen kodiert.
Der Unicode-Zeichensatz selbst unterstützt keine Sprachen, jedoch deren Schriftzeichen. So umfasst der Unicode-Zeichensatz nahezu alle bekannten, sinntragende Zeichen. Auf DecodeUnicode.org kannst du dir insgesamt 98884 Zeichen, beziehungsweise deren Glyphen, anschauen.

Der Vorteil von Unicode ist, dass eben alle Zeichen direkt kodiert werden können und nicht durch Zeichenreferenzen oder ähnliches dargestellt werden müssen. Kodierungen wie „ä“, „ß“, etc. sind also nicht mehr nötig.
__________________
Markus Wulftange
Mit Zitat antworten
Sponsored Links
  #3 (permalink)  
Alt 09.01.2008, 11:37
Neuer Benutzer
neuer user
Thread-Ersteller
 
Registriert seit: 09.01.2008
Beiträge: 4
clark befindet sich auf einem aufstrebenden Ast
Standard

Hey vielen Dank für die schnelle Antwort.

Das war zwar auch wieder technisch, aber diesmal verständlich!

Danke für deine Hilfe!

Gruß,
Marius
Mit Zitat antworten
  #4 (permalink)  
Alt 09.01.2008, 11:41
Benutzerbild von Gumbo
XHTMLforum-Kenner
 
Registriert seit: 22.08.2004
Ort: Trier
Beiträge: 2.733
Gumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekannt
Standard

Vielleicht findest du Michael Jendryschiks Erklärung zu Zeichenkodierung verständlicher. Das Thema lässt sich aber leider nicht ohne technische Erläuterungen erklären.
__________________
Markus Wulftange
Mit Zitat antworten
  #5 (permalink)  
Alt 09.01.2008, 12:29
Benutzerbild von heiko_rs
Erfahrener Benutzer
XHTMLforum-Kenner
 
Registriert seit: 18.09.2005
Ort: Berlin
Beiträge: 9.848
heiko_rs ist ein wunderbarer Anblickheiko_rs ist ein wunderbarer Anblickheiko_rs ist ein wunderbarer Anblickheiko_rs ist ein wunderbarer Anblickheiko_rs ist ein wunderbarer Anblickheiko_rs ist ein wunderbarer Anblickheiko_rs ist ein wunderbarer Anblick
Standard

Um mal mit einem rein praktischen Beispiel die Möglichkeiten von utf-8 zu preisen: Ich mußte letztes Jahr eine von mir erstellte Website auf Chinesisch übertragen. Die dazugehörigen Word-Dokumente kamen per Email aus Peking. Dann nix weiter als Copy & Paste und die Seite lief sofort perfekt. Mit utf-8 geht einfach alles.
Mit Zitat antworten
  #6 (permalink)  
Alt 09.01.2008, 12:31
Neuer Benutzer
neuer user
Thread-Ersteller
 
Registriert seit: 09.01.2008
Beiträge: 4
clark befindet sich auf einem aufstrebenden Ast
Standard

Hm okay, den Sinn verstehe ich jetzt. Wozu sind dann aber UTF-16 und UTF-32 da, wenn UTF-8 selbst Chinesisch kann?

Ich dachte bis dato immer, dass so ein komplexe Sprache wie Chinesisch mindestens UTF-16 benötigen würde...

Wirklich nett, dass ihr so genau versucht das zu erklären.

Gruß,
Clark
Mit Zitat antworten
  #7 (permalink)  
Alt 09.01.2008, 12:42
Benutzerbild von Gumbo
XHTMLforum-Kenner
 
Registriert seit: 22.08.2004
Ort: Trier
Beiträge: 2.733
Gumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekannt
Standard

UTF-8, UTF-16 und UTF-32 sind alles Unicode-Kodierungen mit unterschiedliche Wortlänge. Bei UTF-16 un UTF-32 sind es 16 beziehungsweise 32 Bit, bei UTF-8 je nach Position des zu kodierenden Zeichens acht, 16, 24 oder 32 Bit.

Der Vorteil von UTF-8 gegenüber den anderen UTF-Kodierungen ist, dass eben nur so viele Bits wie unbedingt nötig verwendet werden. So benötigt beispielsweise das „a“ (U+0061) in UTF-8 nur acht Bit, in UTF-16 jedoch 16 und UTF-32 eben 32 Bit.
__________________
Markus Wulftange

Geändert von Gumbo (09.01.2008 um 12:45 Uhr)
Mit Zitat antworten
  #8 (permalink)  
Alt 09.01.2008, 12:45
Neuer Benutzer
neuer user
Thread-Ersteller
 
Registriert seit: 09.01.2008
Beiträge: 4
clark befindet sich auf einem aufstrebenden Ast
Standard

Ahhhh okay - gecheckt!

Vielen Dank für eure Hilfe, dann kann ich UTF-8 ja beruhigt für internationale Seiten verwenden.

Gruß,
Clark
Mit Zitat antworten
  #9 (permalink)  
Alt 09.01.2008, 13:34
Benutzerbild von Gumbo
XHTMLforum-Kenner
 
Registriert seit: 22.08.2004
Ort: Trier
Beiträge: 2.733
Gumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekanntGumbo ist jedem bekannt
Standard

Wichtig ist dabei noch, explizit UTF-8 als zu verwendende Kodierung anzugeben. Denn in den meisten Webbrowsern ist ISO 8859-1 als Standardkodierung/-zeichensatz eingestellt. (Siehe auch Sonderzeichen falsch dagestellt.)
Zudem solltest du auf die BOM verzichten, da diese einerseits für UTF-8 nicht notwendig ist und ebenfalls zu Fehlinterpretationen führen kann.
__________________
Markus Wulftange
Mit Zitat antworten
Sponsored Links
  #10 (permalink)  
Alt 09.01.2008, 14:20
Benutzerbild von Loïs Bégué
Erfahrener Benutzer
XHTMLforum-Mitglied
 
Registriert seit: 24.06.2007
Ort: Freiburg (D)
Beiträge: 779
Loïs Bégué wird schon bald berühmt werden
Standard

http://xhtmlforum.de/46614-merkzette...-berblick.html


Etwas könnte Dich verwirren:
Im (X)HTML Standard (u.a.) werden die Begriffe "Kodierung" und "Character set" zum Teil unglücklich/unlogisch vermischt bzw.gemixt.

Die Angabe
Zitat:
<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1" />
ist valid und logisch korrekt

Die Angabe
Zitat:
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
ist zwar valid aber logisch inkorrekt.

Logisch korrekt (aber leider nicht valid) wäre so etwas wie:
Zitat:
<meta http-equiv="Content-Type" content="text/html; charset=Unicode; coding=UTF-8" />
Denn:
- "ISO-8859-1" steht für einen Zeichensatz (character set)
- "UTF-8" steht für eine bestimmte Form der Kodierung aller Unicode Zeichen

Aber:
Für Dich wichtig ist zunächst nur wie der Standard definiert ist bzw. wie er funktioniert
Und das reicht für's Schreiben/Programmieren von Internetseiten.
__________________
To attain knowledge, add things everyday. To obtain wisdom, remove things everyday. (Lao Tzu)
Links : Some needfull links (Delphi, XHTML...)
Tools : Arpoon Freeware (Checksum...)
Mit Zitat antworten
Sponsored Links
Antwort

Themen-Optionen
Ansicht

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus



Alle Zeitangaben in WEZ +2. Es ist jetzt 00:14 Uhr.