@legman - ich bin auch nicht der Fachmann, aber die utf-8 Kodierung als auch andere (utf-16, utf-32) nutzen bytefolgen, damit man weiss, wieviele Bytes ein Zeichen hat. Dies passiert immer vor den Nicht-Ascii-Zeichen.
Wenn Du Dir mal eine als utf-8 Datei in einem Browser ansiehst ohne die Charset-Anweisung, dann siehst Du z.B. statt einem für ein für. Daran erkennst Du schon, das er das ü als 2 zeichen vermutet, ist aber das erste Byte das Steuerbyte.
Wenn man utf-8 kodiert gespeichert hat, so wie Terry, aber keine Browser-Anweisung für utf-8 gesetzt hat, kommt es bei Umlauten zu Problemen.
Toscho könnte das bestimmt noch fachlicher ausdrücken, aber ich hoffe der Ansatz hilft.
|