tibrandt
15-07-2008, 10:03
Hallo,
ich muss eine Textdatei verarbeiten.
Diese ist nach iso-8859-1 erstellt worden.
Leider wird die ISO-Norm nicht immer eingehalten, das heißt, es sind auch komische Zeichen, wie französische Buchstaben oder “<9f>“ in der Datei enthalten.
Wie man mit “sed“ Umlaute bereinigt weis ich, funktioniert auch.
Meine Frage ist, wie bekomme ich diese nicht erlaubte Zeichen aus der Textdatei heraus.
Ich möchte nicht für jedes Zeichen eine Regel schreiben.
Bash-Skript Ansatz wäre gut!
Danke!
Tino Brandt
ich muss eine Textdatei verarbeiten.
Diese ist nach iso-8859-1 erstellt worden.
Leider wird die ISO-Norm nicht immer eingehalten, das heißt, es sind auch komische Zeichen, wie französische Buchstaben oder “<9f>“ in der Datei enthalten.
Wie man mit “sed“ Umlaute bereinigt weis ich, funktioniert auch.
Meine Frage ist, wie bekomme ich diese nicht erlaubte Zeichen aus der Textdatei heraus.
Ich möchte nicht für jedes Zeichen eine Regel schreiben.
Bash-Skript Ansatz wäre gut!
Danke!
Tino Brandt