XHTMLforum

XHTMLforum (http://xhtmlforum.de/index.php)
-   Serveradministration und serverseitige Scripte (http://xhtmlforum.de/forumdisplay.php?f=80)
-   -   Dokumente und Includes mit Zeichenkodierungen UTF-8 und ASCII (http://xhtmlforum.de/showthread.php?t=66454)

AndreasB 20.12.2011 16:16

Dokumente und Includes mit Zeichenkodierungen UTF-8 und ASCII
 
Includes, die keine Zeichen ausserhalb des ASCII-Satzes enthalten, werden von meinem Editor Ultraedit automatisch in der Zeichenkodierung ASCII gespeichert.
Auch wenn ich zuvor manuell die Kodierung auf UTF-8 setze.

Gegeben sei folgende Situation:
Dokument example.php UTF-8
Include foo.inc ASCII
Include bar.inc UTF-8

bar.inc wird in foo.inc eingefügt.
foo.inc wird in example.php eingefügt.

.htaccess enthält "AddDefaultCharset utf-8"

Wie schließt ihr bei Euren Projekten, wo Includes vorkommen, aus, dass Zeichen bei ausgelieferten Dokumenten falsch kodierte Zeichen enthalten?

Danke.

Scheppertreiber 20.12.2011 16:44

ASCII ist doch eine Untermenge von utf8 ?

inta 20.12.2011 19:23

UTF-8 ohne BOM kann der Editor höchstens anhand der enthaltenen Zeichenketten versuchen zu erkennen. Wenn nur ASCII-Zeichen enthalten sind, kann er auch nichts weiter erkennen, da wie Schepper schon sagt alle ASCII-Zeichen auch in UTF-8 gleich kodiert sind. Um das Problem zu umgehen, habe ich meine Editoren und IDEs so konfiguriert, dass standardmäßig immer von einer UTF-8-Kodierung ausgegangen wird.

AndreasB 22.12.2011 09:37

Bei dem Szenario, welches ich im Ausgangsposting skizziere, werden die Zeichen aus "bar.inc" nicht korrekt dargestellt.

Möglicherweise muss ich nochmal in der Konfiguration von Ultraedit graben, um den Editor so einzustellen wie Du, Inta.

Oder hat das etwas mit der Konfiguration des ausliefernden Servers zu tun?

(Es kann sein, dass ich mich erst in einigen Tagen wieder zurückmelden kann.)

protonenbeschleuniger 22.12.2011 09:42

Zitat:

Zitat von AndreasB (Beitrag 507950)
Oder hat das etwas mit der Konfiguration des ausliefernden Servers zu tun?

Wenn man wüßte was "das" ist, könnte man das vielleicht sagen. Aber wir Wissen nicht, was "nicht korrekt dargestellt" bedeutet.

Scheppertreiber 22.12.2011 09:49

Ich vermute "lesbar" ;)

Schau mal nach ob Dein Editor sich "automatisch" auf den verwendeneten
Zeichensatz einstellt - textpad hat mich da schon ziemlich reingelegt.

Besser, es fallem einem unterschiedliche Codierungen sofort auf ...

protonenbeschleuniger 22.12.2011 10:02

Wie gesagt, wenn wir wüßten was genau das Problem ist, müßte hier keiner raten, sondern wir könnten helfen.

mermshaus 22.12.2011 13:19

Dieses Tool vom W3C macht recht offensichtlich, welche Kodierung für ein Dokument angenommen wird und wieso:

- W3C I18n Checker

Das funktioniert natürlich am besten mit der Angabe eines URL statt eines Uploads, da nur dann auch etwaige Header berücksichtigt werden, die der jeweilige ausliefernde Server ergänzt.

AndreasB 23.12.2011 14:49

Danke für Eure Antworten.
Ich werde nach Weihnachten ein Testcase hochladen und auf die Nachfragen eingehen.
Schöne Tage :)


Alle Zeitangaben in WEZ +2. Es ist jetzt 07:54 Uhr.

Powered by vBulletin® Version 3.8.11 (Deutsch)
Copyright ©2000 - 2024, vBulletin Solutions, Inc.

© Dirk H. 2003 - 2023