hallo,
wie kann ich eine wortliste umändern, sodass alle umlaute korrekt angezeigt werden....kann ruhig auch im terminal sein
problem: hab ne wortliste von einem anderen system auf meines kopiert (weiss jetzt nicht ob das ein dos oder unix textformat ist....wie erkenn ich das am schnellsten?)
alle wörter da drin haben die umlaute falsch
bei mir auf dem pc hab ich de_AT.UTF-8 drauf
noch ne blöde frage, welcher zeichensatz ist für grösstmögliche kompatibilität zu bevorzugen?
gruss günter
Linux 15.028 Themen, 107.048 Beiträge
Vorher Datei sichern, das ist klar ;-)
Grober Schuss aus der Hüfte mit sed:
sed 's/krüppel-ä/ä/g' -i /zu/ändernde/datei
Das muss natürlich für jeden Umlaut wiederholt werden.
Oder mit iconv, da musst du aber altes und neues Charset kennen:
iconv -f ISO-8859-1 -t UTF-8 /zu/ändernde/datei > /geänderte/datei
Den Dateityp erkennst du am Zeilenumbruch, Unix nutzt nur CR, Mac nutzt LF, DOS/Windows CR+LF. mcedit stellt das schön dar.
Als Zeichensatz würd ich anno 2010 UTF-8 verwenden. Allerdings könnte latin1 bis auf weiteres weniger Probleme unter antiken Systemen wie Windows machen. Grundsätzlich gilt "Ausprobieren" :-)