UTF8 macht Arbeit

tempa wrote this 17:25:

Mehr und mehr Systeme steigen um auf UTF8 und schon geht es los mit dem Konvertieren.

Erst ein mal klären was UTF8 überhaupt ist und warum uns das nun interessieren muss?

UTF-8 (Abk. für 8-bit Unicode Transformation Format) ist die populärste Kodierung für Unicode-Zeichen; dabei wird jedem Unicode-Zeichen eine speziell kodierte Bytekette von variabler Länge zugeordnet. UTF-8 unterstützt bis zu 4 Byte, auf die sich wie bei allen UTF-Formaten alle 1.114.112 Unicode-Zeichen abbilden lassen.

Quelle: Wikipaedia zu UTF8

Die meisten habe schon von ASCII (DOS) oder ANSI (MS-DOS) gehört. Unter diesen Bezeichnungen sind ältere Zeichensätze bekannt. Und so wie vor vielen vielen Jahren man mit DOS-Texten in MS Word so seinen Heckmeck hatte mit den Sonderzeichen und Umlauten, so hat man das nun mit UTF8 und der M$-DOSE. Besser gesagt mit dem Zeichensatz-Standard ISO 8859, wie das, was ich als ANSI-Text kennenlernte, korrekt bezeichnet wird.

In Webseiten erkennt man den älteren Standard an folgender Zuweisung: charset=iso-8859-1

CMS-Systeme verwenden im Backend entweder das eine oder das andere. WordPress verwendet standardmäßig UTF8 und Editland verwendet in der deutschen Version iso-8859-1 und in der neueren englischen Version bereits UTF8.

Dass die deutsche Version noch nicht umgestellt wurde, hat seine Gründe in der Systemrealität deutscher Unternehmen. Aktuell gibt es kaum vernünftige Werkzeuge für die lokale Platte. Ich hatte von einem Jahr gerade Mal zwei Editoren ausfindig gemacht. Mein Favorit ist hier PSPad. Gestern Nacht suchte ich ein Plug&Play-Batchconverter. Bin aber leider nicht fündig geworden. Doch das Thema wird und nun immer häufiger beschäftigen. Nach UTF8 habe ich den Unifier gefunden leider tut’s der nicht in der umgekehrten Richtung. Tipps werden gerne entgegen genommen.

Es sollte vielleicht noch dazu gesagt werden, dass UTF8 der bessere Standard ist und es wirklich nur an den ollen Proprietären Softwäre-Stückchen liegt, die ziemlich viel Mist machen, dass ich aktuell noch sehr vorsichtig bin, wann ich eine Site in UTF8 anlege.

Leave a Reply