zurück zur Startseite
  


Zurück XHTMLforum > (X)HTML und CSS > (X)HTML
Seite neu laden Zeichensatz: UTF-8 oder Windows-1252

Antwort
 
LinkBack Themen-Optionen Ansicht
  #41 (permalink)  
Alt 25.03.2012, 23:29
Benutzerbild von protonenbeschleuniger
Verbesserer
XHTMLforum-Kenner
 
Registriert seit: 06.09.2007
Beiträge: 4.899
protonenbeschleuniger ist ein wunderbarer Anblickprotonenbeschleuniger ist ein wunderbarer Anblickprotonenbeschleuniger ist ein wunderbarer Anblickprotonenbeschleuniger ist ein wunderbarer Anblickprotonenbeschleuniger ist ein wunderbarer Anblickprotonenbeschleuniger ist ein wunderbarer Anblick
Standard

Zitat:
Zitat von web334 Beitrag anzeigen
Was stimmt denn bei der Seite SG TSV/DJK Herrieden - Tennisabteilung nicht?
Du meinst Tennisabteilung SG TSV/DJK Herrieden - Startseite

Neben den falschen Angaben in den Headern, hast du auch noch Dateien mit BOM abgespeichert. z.b. diese Seite Tennisabteilung Herrieden
Mit Zitat antworten
Sponsored Links
  #42 (permalink)  
Alt 26.03.2012, 06:24
Benutzerbild von toscho
Perplexifikator
XHTMLforum-Kenner
 
Registriert seit: 22.05.2004
Ort: Halle/Saale
Beiträge: 1.566
toscho sorgt für eine eindrucksvolle Atmosphäretoscho sorgt für eine eindrucksvolle Atmosphäre
Standard

Mal kurz zum Windows-1252-Bashing: Das ist Unsinn. Tatsächlich hat Microsoft damals (Ende der 80er) eine sehr elegante Lösung für ein kniffliges Problem gefunden: Man konnte im 16-bit-Windows keine Multibyte-Kodierung verwenden (UTF-8 ist ohnehin erst viel später entstanden), also hat man die ISO-8859-x-Gruppen genommen und die schon damals unsinnigen Leergruppen mit häufig genutzten Zeichen belegt.

Damit kommt jeder mir bekannte Browser seit mindestens 15 Jahren problemlos zurecht. Es liegt auch nicht mehr in Microsofts Hand, diese Kodierung abzuschaffen, dazu ist sie viel zu weit verbreitet, und man kann eine Registrierung bei der IANA auch nicht einfach zurücknehmen …

Im Unterschied dazu sehe man sich die Katastrophe Mac-Roman an. Das war wirklich eine rücksichtslose Insellösung, die niemand verwenden wollte.

Ich erlaube mir hier einen Hinweis auf meine Artikel zur Zeichenkodierung und UTF-8. Da habe ich versucht, das Wichtigste zu diesen Themen verständlich darzustellen.
__________________
toscho.de
Mit Zitat antworten
Sponsored Links
  #43 (permalink)  
Alt 26.03.2012, 08:45
Erfahrener Benutzer
XHTMLforum-Mitglied
 
Registriert seit: 02.01.2007
Beiträge: 241
web334 befindet sich auf einem aufstrebenden Ast
Standard

Irgendwie verstehe ich jetzt gar nichts mehr.
Es geht mir nur um das Dokument SG TSV/DJK Herrieden - Tennisabteilung
o.k. dieses ist mit BOM abgespeichert. Ich habe mich gerade Notepad++ runtergeladen und werde die Datei noch heute bearbeiten. Aber was stimmt sonst nicht mit der Datei bzw. mit dem angegebenen Zeichensatz?
Mit Zitat antworten
  #44 (permalink)  
Alt 26.03.2012, 08:46
Erfahrener Benutzer
XHTMLforum-Mitglied
 
Registriert seit: 13.07.2006
Beiträge: 748
mermshaus ist ein wunderbarer Anblickmermshaus ist ein wunderbarer Anblickmermshaus ist ein wunderbarer Anblickmermshaus ist ein wunderbarer Anblickmermshaus ist ein wunderbarer Anblickmermshaus ist ein wunderbarer Anblick
Standard

Na ja, „gebasht“ finde ich übertrieben. Windows-1252 hat – wie jede 1-Byte-Kodierung – objektiv benennbare Nachteile. Aber wo du schon davon sprichst: Wir haben mittlerweile 2012, und es gibt (im Content-Bereich) kaum mehr Gründe, auf Kodierungen zu setzen, die inkompatibel mit dem UTF sind und die nicht einmal 255 Zeichen umfassen. Das ist ein Anachronismus und zudem eine sehr westliche Denkweise.

Zitat:
Man konnte im 16-bit-Windows keine Multibyte-Kodierung verwenden (UTF-8 ist ohnehin erst viel später entstanden), also hat man die ISO-8859-x-Gruppen genommen und die schon damals unsinnigen Leergruppen mit häufig genutzten Zeichen belegt.
Ich verstehe nicht, was daran elegant sein soll. Das ist in meinen Augen mehr ein Verlegenheits-Hack, weil keine saubere Lösung verfügbar war. Das kritisiere ich nicht unbedingt, aber elegant?

Zitat:
Damit kommt jeder mir bekannte Browser seit mindestens 15 Jahren problemlos zurecht.
Ja. Aber frag mal einen Russen, wie sinnvoll er den Zeichensatz findet. Ein HTML-Dokument in kyrillischer Schrift kannst du in Windows-1252 so gut schreiben wie in ASCII-7. Das geht nur mit Entities und macht absolut keinen Spaß.

Zitat:
Es liegt auch nicht mehr in Microsofts Hand, diese Kodierung abzuschaffen
Die Kodierung ist in der normalen Welt abgeschafft.

Ich könnte jetzt zum dritten Mal meinen php.de-Thread verlinken. Die Sache mit dem €-Zeichen funktioniert, weil Leute den Unterschied zwischen ISO-8859-1 und Windows-1252 nicht kennen. Das ist keine gute Sache, denn das führt tatsächlich zu Problemen:

- einzelnes Unicode Zeichen ersetzen - PHP-Scripte PHP-Tutorials PHP-Jobs und vieles mehr

(Es wäre gelogen, wenn ich sagen würde, dass mich bei dem Thread keine diebische Freude erfasst hat.)

Viel zu viele Leute können nicht mit Zeichensätzen umgehen. (Ich kann es auch nicht richtig.[1]) Und das W3C legitimiert das in gewisser Weise, indem es diese Windows-1252-Fallbacks „standardisiert“, weil das Kind schon in den Brunnen gefallen ist und man das Web nicht zerstören will. (Zumindest den Teil des Webs, der in Euro zahlt.)



1: fireweasel sagt da in #11 einen ganz wunderbaren Satz:

Zitat:
In der Praxis werden es, wie immer, (fast) alle ignorieren.

Geändert von mermshaus (26.03.2012 um 09:06 Uhr)
Mit Zitat antworten
  #45 (permalink)  
Alt 26.03.2012, 09:23
Erfahrener Benutzer
XHTMLforum-Mitglied
 
Registriert seit: 13.07.2006
Beiträge: 748
mermshaus ist ein wunderbarer Anblickmermshaus ist ein wunderbarer Anblickmermshaus ist ein wunderbarer Anblickmermshaus ist ein wunderbarer Anblickmermshaus ist ein wunderbarer Anblickmermshaus ist ein wunderbarer Anblick
Standard

Zitat:
Zitat von web334
Aber was stimmt sonst nicht mit der Datei bzw. mit dem angegebenen Zeichensatz?
Bei mir (Firefox 11) wird es korrekt dargestellt (laut Page Info auch als UTF-8). Vielleicht hat dein Bekannter den Zeichensatz von Hand überschrieben? („View → Character Encoding“ im Hauptmenü vom Firefox.)

Der W3C-Validator ist sehr verwirrt von den verschiedenen Charset-Angaben.

W3C I18n Checker beschwert sich auch. (1 Fehler, Beschreibung steht ganz unten.)

Ich habe keine Ahnung, ob das „none“ als konkrete Angabe zählt oder ob es von der nächstbesten anderen Angabe (BOM, meta-Element) überschrieben wird.

Wenn es als konkrete Angabe zählt (also nicht als „ungesetzt“, sondern als „gesetzt als nichts“), musst du das irgendwie auf Serverebene überschreiben/umkonfigurieren. Zum Beispiel per .htaccess-Datei (falls Apache) oder per header-Anweisung etwa in PHP.
Mit Zitat antworten
  #46 (permalink)  
Alt 26.03.2012, 09:33
Erfahrener Benutzer
XHTMLforum-Mitglied
 
Registriert seit: 02.01.2007
Beiträge: 241
web334 befindet sich auf einem aufstrebenden Ast
Standard

bei meinem Webspace habe ich die Möglichkeit zur Deaktivierung des Standardzeichensatzes (add_default_charset = OFF)
zur Zeit ist der Standardzeichensatz nicht aktiviert.
Oder sollte ich diesen wieder aktivieren?
Mit Zitat antworten
  #47 (permalink)  
Alt 26.03.2012, 09:41
Benutzerbild von protonenbeschleuniger
Verbesserer
XHTMLforum-Kenner
 
Registriert seit: 06.09.2007
Beiträge: 4.899
protonenbeschleuniger ist ein wunderbarer Anblickprotonenbeschleuniger ist ein wunderbarer Anblickprotonenbeschleuniger ist ein wunderbarer Anblickprotonenbeschleuniger ist ein wunderbarer Anblickprotonenbeschleuniger ist ein wunderbarer Anblickprotonenbeschleuniger ist ein wunderbarer Anblick
Standard

Wenn das die Auswirkungen durch diese Deaktivierung sind, solltest du deinen Anbieter darauf hinweisen, dasss charset=none falsch ist.

Vielleicht haben sie dieses Dokument falsch verstanden http://www.iana.org/assignments/character-sets
Code:
Name: UTF-8                                                    [RFC3629]
MIBenum: 106
Source: RFC 3629
Alias: None
Mit Zitat antworten
  #48 (permalink)  
Alt 26.03.2012, 09:59
Erfahrener Benutzer
XHTMLforum-Mitglied
 
Registriert seit: 02.01.2007
Beiträge: 241
web334 befindet sich auf einem aufstrebenden Ast
Standard

Ich habe dem Standard Zeichensatz nun wieder aktiviert.
Mit Zitat antworten
  #49 (permalink)  
Alt 26.03.2012, 10:34
Benutzerbild von protonenbeschleuniger
Verbesserer
XHTMLforum-Kenner
 
Registriert seit: 06.09.2007
Beiträge: 4.899
protonenbeschleuniger ist ein wunderbarer Anblickprotonenbeschleuniger ist ein wunderbarer Anblickprotonenbeschleuniger ist ein wunderbarer Anblickprotonenbeschleuniger ist ein wunderbarer Anblickprotonenbeschleuniger ist ein wunderbarer Anblickprotonenbeschleuniger ist ein wunderbarer Anblick
Standard

Was letztlich keine Änderung bringen wird. Wie gesagt es ist ein Fehler deines Anbieters, solange der das nicht behebt, solange musst du damit leben, dass es Leute gibt die die Seite falsch sehen.

Was mir aber nicht klar war, dass manche Browser anscheinend versuchen die richtige Kodierung rauszufinden. Anders kann ich mir nicht erklären, warum Firefox die HTTP Kodierung ignoriert. Aber Opera und Webkit machen das nicht und zeigen die Seite mit kaputten Umlauten an.
Mit Zitat antworten
Sponsored Links
  #50 (permalink)  
Alt 26.03.2012, 19:07
Standardkatze
XHTMLforum-Kenner
 
Registriert seit: 06.02.2007
Beiträge: 1.826
gato ist einfach richtig nettgato ist einfach richtig nettgato ist einfach richtig nettgato ist einfach richtig nettgato ist einfach richtig nett
Standard

Zitat:
Zitat von toscho Beitrag anzeigen
Damit kommt jeder mir bekannte Browser seit mindestens 15 Jahren problemlos zurecht.
Mit UTF-8 kommen die Browser auch schon eine ganze Weile lang zurecht

Zitat:
Zitat von toscho Beitrag anzeigen
Im Unterschied dazu sehe man sich die Katastrophe Mac-Roman an. Das war wirklich eine rücksichtslose Insellösung, die niemand verwenden wollte.
Leider nicht die erste Insellösung von Apple... Apple ist das neue Microsoft.

Zitat:
Zitat von mermshaus Beitrag anzeigen
Das ist ein Anachronismus und zudem eine sehr westliche Denkweise.
Allerdings: Unicode und dessen Sortiertung z.B. asiatischer Schriftzeichen wird in diesem Raum durchaus kritisiert. Tatsächlich kenne ich auch keine japanische Seite, die Unicode verwendet.

Zitat:
Zitat von mermshaus Beitrag anzeigen
Ich habe keine Ahnung, ob das „none“ als konkrete Angabe zählt oder ob es von der nächstbesten anderen Angabe (BOM, meta-Element) überschrieben wird.
Witzigerweise ist ISO-8859-1 die Standardkodierung, die angenommen wird, wenn im HTTP-Header ein unültiger Wert (wie "none") angegeben wird (gemäß HTTP-Spezifikation).

Zitat:
Zitat von protonenbeschleuniger Beitrag anzeigen
Was mir aber nicht klar war, dass manche Browser anscheinend versuchen die richtige Kodierung rauszufinden. Anders kann ich mir nicht erklären, warum Firefox die HTTP Kodierung ignoriert. Aber Opera und Webkit machen das nicht und zeigen die Seite mit kaputten Umlauten an.
Ich bewege mich aufs Glatteis un behaupte, dass das Verhalten des Firefox durch HTML5 8.2.2.4 Schritt 5 erlaubt ist.
Allerdings wundert es mich, dass die anderen Browser (insbesondere der IE) da nicht mitspielen. Bei WebKit kann es ein Bug sein und Opera hat noch keinen HTML5-Parser in einer Benutzerversion.

Zitat:
Zitat von protonenbeschleuniger Beitrag anzeigen
Neben den falschen Angaben in den Headern, hast du auch noch Dateien mit BOM abgespeichert. z.b. diese Seite Tennisabteilung Herrieden
P.S. Verrate mir bitte, wie du das "auf einen Blick" erkennen kannst, falls ich richtig annehme, dass du das auf einen Blick erkennen konntest
__________________
Über Internet Explorer 8:
Noch bis 8. April 2014 wird der Internet Explorer 6 mit Sicherheitsupdates versorgt.
Bereits jetzt kann dieser Browser aber vollständig durch den IE8 ersetzt werden. Ältere Betriebssysteme und Browserversionen werden von Microsoft nicht mehr unterstützt.
Auch Programme, die den IE7 benötigen, sind kein Argument gegen IE8, da dieser über entsprechende Kompatibilitätsschichten verfügt.
Ab sofort gilt daher der Internet Explorer 8 als vorausgesetzer Mindeststandard.
Mit Zitat antworten
Sponsored Links
Antwort

Themen-Optionen
Ansicht

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus


Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Chat-Thread paracelsus Offtopic 22829 10.09.2017 23:04
Scribus (Windows) und der komplette Zeichensatz David Grafik, Design, Typografie 2 02.12.2010 12:33
Zeichensatz von Textdateien unter Windows??? markuskoehler Serveradministration und serverseitige Scripte 10 08.12.2008 16:49
Unterschied im Zeichensatz von localhost zu webspace rockpianist Serveradministration und serverseitige Scripte 11 17.11.2008 17:41


Alle Zeitangaben in WEZ +2. Es ist jetzt 19:49 Uhr.