zurück zur Startseite
  


Zurück XHTMLforum > (X)HTML und CSS > (X)HTML
Seite neu laden Zeichensatz: UTF-8 oder Windows-1252

Antwort
 
LinkBack Themen-Optionen Ansicht
  #1 (permalink)  
Alt 17.03.2012, 21:39
Benutzerbild von dercoe
Wissbegierig
XHTMLforum-Mitglied
Thread-Ersteller
 
Registriert seit: 02.01.2010
Ort: NRW
Beiträge: 115
dercoe befindet sich auf einem aufstrebenden Ast
Standard Zeichensatz: UTF-8 oder Windows-1252

Hallo zusammen,

habe mir einen neuen HTML-CSS-Editor zugelegt (PHP Editor 2011).

Dieser unterstützt standardgemäß den Zeichensatz UTF-8.

Vorher habe ich mit dem Notepad++ meine Seiten geschrieben. Der aber hat den Zeichensatz auf Windows-1252 eingestellt, demnach sind alle meine bisherigen Seiten im Windows-1252-Format gespeichert.

Nun möchte ich für die zukünftigen Projekte wissen, ob es sinnvoller wäre neue Seiten direkt im UTF-8-Format zu schreiben?

Das der Server den Zeichensatz unterstützen muss ist mir klar, nur gibt es die Aussage "UTF-8 ist der neue Webstandard"?

Noch eine weitere Frage: Wäre es sinnvoll, die bisher funktionierenden Seiten im Windows-1252-Format auf UTF-8 umzustellen, oder sind da Probleme mit Sonderzeichen und Umlauten zu erwarten?


Gruß
Marko
Mit Zitat antworten
Sponsored Links
  #2 (permalink)  
Alt 17.03.2012, 21:54
Benutzerbild von Praktikant
Semantikbremse.
XHTMLforum-Kenner
 
Registriert seit: 22.04.2008
Beiträge: 4.985
Praktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz sein
Standard

Zitat:
Zitat von dercoe Beitrag anzeigen
Vorher habe ich mit dem Notepad++ meine Seiten geschrieben. Der aber hat den Zeichensatz auf Windows-1252 eingestellt, demnach sind alle meine bisherigen Seiten im Windows-1252-Format gespeichert.
Dir ist schon klar, dass im Web auch Systeme unterwegs sind, die Zeichensätze von Windows nicht haben, weil sie nicht Windows sind?
Zitat:
Zitat von dercoe Beitrag anzeigen
Nun möchte ich für die zukünftigen Projekte wissen, ob es sinnvoller wäre neue Seiten direkt im UTF-8-Format zu schreiben?
Ja.
Zitat:
Zitat von dercoe Beitrag anzeigen
Das der Server den Zeichensatz unterstützen muss ist mir klar
Wo hast du denn den Müll her?
Zitat:
Zitat von dercoe Beitrag anzeigen
Noch eine weitere Frage: Wäre es sinnvoll, die bisher funktionierenden Seiten im Windows-1252-Format auf UTF-8 umzustellen
Ja. Wahrscheinlich sind dann auch Probleme bei Zeichen zu erwarten.

UTF-8 ist der "neue" Standard.
__________________
Rettet die Erde.... sie ist der einzige Planet mit Schokolade!
Mit Zitat antworten
Sponsored Links
  #3 (permalink)  
Alt 17.03.2012, 21:57
Standardkatze
XHTMLforum-Kenner
 
Registriert seit: 06.02.2007
Beiträge: 1.820
gato ist einfach richtig nettgato ist einfach richtig nettgato ist einfach richtig nettgato ist einfach richtig nettgato ist einfach richtig nett
Standard

Zitat:
Zitat von dercoe Beitrag anzeigen
habe mir einen neuen HTML-CSS-Editor zugelegt (PHP Editor 2011).

Dieser unterstützt standardgemäß den Zeichensatz UTF-8.
Ich kenne besagten Editor nicht, aber er scheint schon mal einiges richtig zu machen.

Zitat:
Zitat von dercoe Beitrag anzeigen
Vorher habe ich mit dem Notepad++ meine Seiten geschrieben. Der aber hat den Zeichensatz auf Windows-1252 eingestellt, demnach sind alle meine bisherigen Seiten im Windows-1252-Format gespeichert.
Tatsächlich? Ich weiß nicht mehr welche Kodierung N++ frisch installiert verwendet, aber ihn auf UTF-8 umzustellen ist ein Handumdrehen.

Zitat:
Zitat von dercoe Beitrag anzeigen
Nun möchte ich für die zukünftigen Projekte wissen, ob es sinnvoller wäre neue Seiten direkt im UTF-8-Format zu schreiben?
Ja.

Mehr muss man dazu nicht sagen. Aber falls es dir nicht klar ist: In UTF-8 kodierten Dokumenten kannst du nicht nur Umlaute, sondern jedes Zeichen des Unicode-Zeichenschatzes darstellen: z.B. Aleph (א) oder Murakami Haruki (村上 春樹). - Ganz ohne die lästigen Zeichenreferenzen (&#x123).

Zitat:
Zitat von dercoe Beitrag anzeigen
Das der Server den Zeichensatz unterstützen muss ist mir klar, nur gibt es die Aussage "UTF-8 ist der neue Webstandard"?
Nein und Nein.
Der Server muss die Daten nur an den Browser senden können. Es ist deine Aufgabe, dass die gesendete Datei richtig kodiert ist und du der Empfängerseite (dem Browser) auch mitteilst, welche Kodierung du verwendest. Das geschieht mittels HTTP-Header oder besser (weil direkt im Dokument verankert) eine Meta-Angabe (die natürlich als erstes Kindelement des head-Elements auftreten muss - anderfalls müsste der Browser das Dokument zeurst dekodieren um zu erfahren, mit welcher Kodierung das Dokument kodiert wurde).

Das zweite "Nein" bezieht sicht auf die Aussage, dass UTF-8 neu sei. Das stimmt nicht Die UTF-8-Kodierung, bzw. der Unicode Standard wird von Microsoft seit Windows 95 unterstützt. Das sollte dir klar machen, wieso du keine Probleme fürchten musst.

Zitat:
Zitat von dercoe Beitrag anzeigen
Noch eine weitere Frage: Wäre es sinnvoll, die bisher funktionierenden Seiten im Windows-1252-Format auf UTF-8 umzustellen, oder sind da Probleme mit Sonderzeichen und Umlauten zu erwarten?
Ja, es wäre sinnvoll (von Aufwand abgesehen, z.B. 1000 Seiten umzukodieren).

Wenn dein Editor das Konvertieren von einer Kodierung zur anderen unterstützt (so wie es N++ tut), dann musst du keine Nachteile befürchten. Du musst lediglich dem Browser auch mitteilen, dass du eine andere Kodierung verwendest.

Zudem bin ich mir nichtmal sicher ob Windows-1252 korrekt von Linux oder Mac/iPhone unterstützt wird.
__________________
Über Internet Explorer 8:
Noch bis 8. April 2014 wird der Internet Explorer 6 mit Sicherheitsupdates versorgt.
Bereits jetzt kann dieser Browser aber vollständig durch den IE8 ersetzt werden. Ältere Betriebssysteme und Browserversionen werden von Microsoft nicht mehr unterstützt.
Auch Programme, die den IE7 benötigen, sind kein Argument gegen IE8, da dieser über entsprechende Kompatibilitätsschichten verfügt.
Ab sofort gilt daher der Internet Explorer 8 als vorausgesetzer Mindeststandard.
Mit Zitat antworten
  #4 (permalink)  
Alt 17.03.2012, 22:03
Benutzerbild von Praktikant
Semantikbremse.
XHTMLforum-Kenner
 
Registriert seit: 22.04.2008
Beiträge: 4.985
Praktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz sein
Standard

Zitat:
Zitat von gato Beitrag anzeigen
Zudem bin ich mir nichtmal sicher ob Windows-1252 korrekt von Linux oder Mac/iPhone unterstützt wird.
Das könnte man einfach feststellen, wenn der TE einen Link zu einer so kodierten Website zur Verfügung stellt
__________________
Rettet die Erde.... sie ist der einzige Planet mit Schokolade!
Mit Zitat antworten
  #5 (permalink)  
Alt 17.03.2012, 22:11
Standardkatze
XHTMLforum-Kenner
 
Registriert seit: 06.02.2007
Beiträge: 1.820
gato ist einfach richtig nettgato ist einfach richtig nettgato ist einfach richtig nettgato ist einfach richtig nettgato ist einfach richtig nett
Standard

Zitat:
Zitat von Praktikant Beitrag anzeigen
Das könnte man einfach feststellen, wenn der TE einen Link zu einer so kodierten Website zur Verfügung stellt
Hab mich gerade daran erinnert, dass HTML5-konforme Browser inzwischen Windows-1252 unterstützen müssen. Es ist die zweite von zwei Kodierungen (die andere ist UTF-8 ) die ein Browser unterstützen muss.

Das ist wohl ein Frontpage-Erbe..

Dennoch ist die UTF-8-Kodierung allen anderen vorzuziehen (zumindest in 99,99% aller Fälle ).
Mit Zitat antworten
  #6 (permalink)  
Alt 18.03.2012, 08:07
Benutzerbild von dercoe
Wissbegierig
XHTMLforum-Mitglied
Thread-Ersteller
 
Registriert seit: 02.01.2010
Ort: NRW
Beiträge: 115
dercoe befindet sich auf einem aufstrebenden Ast
Standard Vielen Dank!

Vielen Dank!

Der Rapid PHP 2011 kann die Umkonvertierung ebenfalls durchführen.

Jetzt hab ich nur noch eine Sache.

Meine Website: Website von Marko Coenen

Schau ich mir die UTF-8-Codierte Seite in meinem Firefox an, und klicke dann auf "Zeichencodierung" im Menü "Ansicht", dann wird mir dort angezeigt, daß die Codierung "Westlich (ISO-8895-1)" sein soll.

Stelle ich dort auf "Unicode UTF-8" um, werden mir alle Umlaute meiner Seite falsch angezeigt.

Oder muss ich jede Seite ins UTF-8-Format umwandeln und nicht nur die Header.php ?

Gruß
Marko
Mit Zitat antworten
  #7 (permalink)  
Alt 18.03.2012, 10:46
Standardkatze
XHTMLforum-Kenner
 
Registriert seit: 06.02.2007
Beiträge: 1.820
gato ist einfach richtig nettgato ist einfach richtig nettgato ist einfach richtig nettgato ist einfach richtig nettgato ist einfach richtig nett
Standard

Zitat:
Zitat von dercoe Beitrag anzeigen
Schau ich mir die UTF-8-Codierte Seite in meinem Firefox an, und klicke dann auf "Zeichencodierung" im Menü "Ansicht", dann wird mir dort angezeigt, daß die Codierung "Westlich (ISO-8895-1)" sein soll.
Das teilt dein Server dem Browser so mit.
Zitat:
Zitat von HTTP-Header von http://www.dercoe.de/
Content-Type: text/html; charset=iso-8859-1
Zitat:
Zitat von dercoe Beitrag anzeigen
Stelle ich dort auf "Unicode UTF-8" um, werden mir alle Umlaute meiner Seite falsch angezeigt.
Dann sind deine Seiten nicht UTF-8 kodiert.

Zitat:
Zitat von dercoe Beitrag anzeigen
Oder muss ich jede Seite ins UTF-8-Format umwandeln und nicht nur die Header.php ?
Selbstverständlich. ISO/Win-1252 kodiert werden Umlaute anders gespeichert als UTF-8 kodiert (die Reihenfolge der Bits unterscheidet sich).

Wenn also ein UTF-8-Dekoder ein ISO/Win kodiertes Dokument dekodiert, wird er anstatt der gewünschten Zeichen dijenigen einfügen, die in seinem Zeichensatz die entsprechende Bitreihenfolge besitzen.
Mit Zitat antworten
  #8 (permalink)  
Alt 18.03.2012, 12:05
Benutzerbild von protonenbeschleuniger
Verbesserer
XHTMLforum-Kenner
 
Registriert seit: 06.09.2007
Beiträge: 4.977
protonenbeschleuniger ist ein wunderbarer Anblickprotonenbeschleuniger ist ein wunderbarer Anblickprotonenbeschleuniger ist ein wunderbarer Anblickprotonenbeschleuniger ist ein wunderbarer Anblickprotonenbeschleuniger ist ein wunderbarer Anblickprotonenbeschleuniger ist ein wunderbarer Anblickprotonenbeschleuniger ist ein wunderbarer Anblick
Standard

Zitat:
Zitat von dercoe Beitrag anzeigen
Jetzt hab ich nur noch eine Sache.

Meine Website: Website von Marko Coenen

Schau ich mir die UTF-8-Codierte Seite in meinem Firefox an, und klicke dann auf "Zeichencodierung" im Menü "Ansicht", dann wird mir dort angezeigt, daß die Codierung "Westlich (ISO-8895-1)" sein soll.
Das ist ein Missverständnis das bis vor kurzem auch so bei Wikipedia falsch stand. Der Zeichensatz eines HTML Dokuments, dass von einem Server ausgeliefert wird, wird nicht durch den meta Tag bestimmt, sondern zuerst durch den HTTP Header. Dieser dominiert immer, nur wenn es keinen gibt, findet der meta Tag Verwendung.
Mit Zitat antworten
  #9 (permalink)  
Alt 18.03.2012, 12:49
Benutzerbild von dercoe
Wissbegierig
XHTMLforum-Mitglied
Thread-Ersteller
 
Registriert seit: 02.01.2010
Ort: NRW
Beiträge: 115
dercoe befindet sich auf einem aufstrebenden Ast
Standard

Zitat:
Zitat von gato Beitrag anzeigen
Das teilt dein Server dem Browser so mit.



Dann sind deine Seiten nicht UTF-8 kodiert.


Selbstverständlich. ISO/Win-1252 kodiert werden Umlaute anders gespeichert als UTF-8 kodiert (die Reihenfolge der Bits unterscheidet sich).

Wenn also ein UTF-8-Dekoder ein ISO/Win kodiertes Dokument dekodiert, wird er anstatt der gewünschten Zeichen dijenigen einfügen, die in seinem Zeichensatz die entsprechende Bitreihenfolge besitzen.
Moin,

jetzt müsst Ihr mir aber auf die Sprünge helfen.

Kann ich den HTTP-Header irgendwie ansprechen? Ich meine, wie wird dem mitgeteilt, daß ich UTF-8 benutzen möchte? Ist das derjenige Header, der mir angezeigt wird wenn ich in der Web Developer Toolbar unter Informationen den Antwort-Header auswähle? Muss dieser über die .htaccess angesprochen werden?

War bislang immer der Meinung, daß der Meta Tag mit <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> für die Zeichencodierung ausreichen sollte. Nun weiß ich aber zumindest, daß jede einzelne Seite als UTF-8 abgespeichert werden muss.

Das mit dem Header verwirrt mich jetzt allerdings etwas.

Gruß
Marko

Geändert von dercoe (18.03.2012 um 12:52 Uhr)
Mit Zitat antworten
Sponsored Links
  #10 (permalink)  
Alt 18.03.2012, 12:52
Benutzerbild von Praktikant
Semantikbremse.
XHTMLforum-Kenner
 
Registriert seit: 22.04.2008
Beiträge: 4.985
Praktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz seinPraktikant kann auf vieles stolz sein
Standard

Zitat:
Zitat von gato Beitrag anzeigen
Das teilt dein Server dem Browser so mit.
Stimmt. Der Server sendet folgenden HTTP-Header:
Code:
HTTP/1.1 200 OK
Date: Sun, 18 Mar 2012 10:47:51 GMT
Server: Apache/2.2.3 (CentOS)
Connection: close
Transfer-Encoding: chunked
Content-Type: text/html; charset=iso-8859-1
Dort steht in der letzten Zeile der zu verwendende Zeichensatz.

Es kann also sein, dass dein Server als Standard diesen Zeichensatz angibt oder du das in der .htaccess so gesetzt hast. Das kannst du allerdings ändern, indem du in deiner .htaccess entweder diese Zeile AddDefaultCharset iso-8859-1 durch AddDefaultCharset UTF-8 oder diese Zeile einfach in deiner .htaccess hinzufügst, falls es noch keine Angabe zu einem Zeichensatz gibt.
__________________
Rettet die Erde.... sie ist der einzige Planet mit Schokolade!
Mit Zitat antworten
Sponsored Links
Antwort

Themen-Optionen
Ansicht

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus


Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Chat-Thread paracelsus Offtopic 22838 27.09.2022 14:27
Scribus (Windows) und der komplette Zeichensatz David Grafik, Design, Typografie 2 02.12.2010 13:33
Zeichensatz von Textdateien unter Windows??? markuskoehler Serveradministration und serverseitige Scripte 10 08.12.2008 17:49
Unterschied im Zeichensatz von localhost zu webspace rockpianist Serveradministration und serverseitige Scripte 11 17.11.2008 18:41


Alle Zeitangaben in WEZ +2. Es ist jetzt 15:33 Uhr.