kostenloser Webspace werbefrei: lima-city


header utf-8 und Daten mit iso-8859-1

lima-cityForumProgrammiersprachenPHP, MySQL & .htaccess

  1. Autor dieses Themas

    suchsmart

    suchsmart hat kostenlosen Webspace.

    wenn ich per php header den Charset auf UTF-8 gestellt habe
    und dann aus einer CSV Daten einlese, die in iso-8859-1 angelegt ist

    kommt dann der Content aus der CSV als UTF-8 im Script / Browser an ?
    also quasi wie mit utf8_encode() ... oder mus ich selber noch utf8_encode() machen?


    und was machen bei Zeichen, die nicht "richtig" in UTF-8 de-/codierbar sind
    z:B. das Euro-Zeichen € oder ein langer Gedankenstrich – (‐)
  2. Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!

    lima-city: Gratis werbefreier Webspace für deine eigene Homepage

  3. suchsmart schrieb:
    ... und was machen bei Zeichen, die nicht "richtig" in UTF-8 de-/codierbar sind
    z:B. das Euro-Zeichen € oder ein langer Gedankenstrich – (‐)
    das dürfte ein generelles misverständniss sein!
    du solltest - dass alles richtig dargestellt wird - folgendes tun:
    1. alle deine scripte mit utf-8 (ohnem BOM) speichern;
    2. du solltest alle deine datenbanken und tabellen in utf-8 anlegen. natürlich da gehören dann auch utf-8 daten rein!
    3. in deinem html sollte
    <meta charset="utf-8" />
    im header enthalten sein.
    das wars.
  4. Autor dieses Themas

    suchsmart

    suchsmart hat kostenlosen Webspace.

    danke, ich bemühe mich ja möglichst auf UTF-8 zu arbeiten

    mein Problem mal andersrum beschrieben

    meine Seite ist grundsätzlich in UTF-8
    ich hole Daten aus externer CSV Datei, auf die ich keinen Einfluss habe
    die CSV ist leider in iso-8859-1 angelegt, das kann ich auch nicht ändern
    Umlaute stehen darin im Klartext, also ä ö ü aber auch € Zeichen, etc.

    vor Ausgabe mache ich also utf8_encode()
    aber die Umwandlung der ISO-Daten in UTF-8 funktioniert nicht vollständig
    bestimmte Zeichen werden nicht richtig codiert mit utf8_encode

    wie gesagt z:B. das Euro-Zeichen € oder ein langer Gedankenstrich – (&dash;)
    aber auch Fehler bei anderen Sonderzeichen, die im "Klartext" ankommen

    gibt es eine Liste der Zeichen, die "falsch" codiert werden?
    bzw. wie kann ich auch diese Zeichen "richtig" zu UTF-8 bringen ?


    Beitrag zuletzt geändert: 15.2.2012 15:47:38 von suchsmart
  5. das ist natürlich eine verzwickte situation ;) fremde quellen könne alles enthalten, was eigentlich schon gar nicht mehr zu kodierung, sondern zu sicherheit gehört. also da kann man generell so gut wie nichts sagen, schon aus dem grund, dass viele webprogrammierer aus eigenen(?) ganz anders kodieren (ich möchte jetzt hier bösartigkeit mal ausschließen ;).
    daher kann ich nur mehr zu so etwas raten: falsch kodiert "utf 8".
  6. Diskutiere mit und stelle Fragen: Jetzt kostenlos anmelden!

    lima-city: Gratis werbefreier Webspace für deine eigene Homepage

Dir gefällt dieses Thema?

Über lima-city

Login zum Webhosting ohne Werbung!