hallo,
wie kann ich eine wortliste umändern, sodass alle umlaute korrekt angezeigt werden....kann ruhig auch im terminal sein
problem: hab ne wortliste von einem anderen system auf meines kopiert (weiss jetzt nicht ob das ein dos oder unix textformat ist....wie erkenn ich das am schnellsten?)
alle wörter da drin haben die umlaute falsch
bei mir auf dem pc hab ich de_AT.UTF-8 drauf
noch ne blöde frage, welcher zeichensatz ist für grösstmögliche kompatibilität zu bevorzugen?
gruss günter
Linux 15.036 Themen, 107.107 Beiträge
Vorher Datei sichern, das ist klar ;-)
Grober Schuss aus der Hüfte mit sed:
sed 's/krüppel-ä/ä/g' -i /zu/ändernde/datei
Das muss natürlich für jeden Umlaut wiederholt werden.
Oder mit iconv, da musst du aber altes und neues Charset kennen:
iconv -f ISO-8859-1 -t UTF-8 /zu/ändernde/datei > /geänderte/datei
Den Dateityp erkennst du am Zeilenumbruch, Unix nutzt nur CR, Mac nutzt LF, DOS/Windows CR+LF. mcedit stellt das schön dar.
Als Zeichensatz würd ich anno 2010 UTF-8 verwenden. Allerdings könnte latin1 bis auf weiteres weniger Probleme unter antiken Systemen wie Windows machen. Grundsätzlich gilt "Ausprobieren" :-)
äääähhh wo seh ich das im mcedit, was das für ein zeichensatz ist?
Indem du das Zeilenende anschaust. Wenn da ein schwarz unterlegtes ^ ist, handelt es sich um eine DOS-Datei mit überflüssigem LF.
Von DOS nach Unix und umgekehrt umwandeln kannst du übrigens mit der Suite dos2unix bzw tofrodos, welches auch erstere enthält. Umwandeln kannst du dann mittels der Befehle todos bzw unix2dos und fromdos bzw dos2unix.
okay hab ne unix datei...habs ja schon vorher mit dos2unix konvetiert.
danke mic
weisst du wo da mein syntaxfehler ist?
sed 's/u"/ü/g' wordliste #alle u" audf ü tauschen...
Auf den ersten Blick hätte ich jetzt gesagt, da fehlt ein "-i".
So schreibt er Dir auf die Standardausgabe.
Gruß
Rheinlaender
das i hat gefehlt....
danke an alle
mit sed hat es hingehauen
gruss günter
Watt? 19:15? Nickles.de scheint seiner Zeit voraus zu sein. *g
scheisse...jetzt seh ichs erst...
@the_mic hatte e die richtige syntax
das jahr fängt ja schon gut an :-)