Ich würde mich in meinem Urlaub gern etwas intensiver mit Deduplikation unter Linux beschäftigen und bin (außer auf Git und den rsync-Hardlink-Geschichten) auf das "lessfs" gestoßen: http://www.linuxjournal.com/content/data-deduplication-linux . Hat jemand der versierteren Foristen sich vielleicht einmal mit dem "lessfs" beschäftigt und als zuverlässig genug für ein reines Datengrab befunden?
Hinweise auf Alternativen werden natürlich gern entgegengenommen :-)
Linux 15.010 Themen, 106.838 Beiträge
Ist kein wirklich kompliziertes Feature, es soll eben Platz sparen.
Jein. Wenn man maximal Platz sparen will dann reicht es auch nicht auf Basis von Dateisystemsektoren zu deduplizieren (auch das würde ich schon nicht als unkompliziert bezeichnen!). z.B. reicht es bei identischen eMail an mehrere Empfänger schon aus wenn sich die Länge des Headers minimal unterscheidet um vollkommen unterschiedliche Sektoren zu produzieren. Das ist dann aber vielleicht auch eine Deduplizierung die man besser erst mit Verzögerung durchführt weil es sonst wirklich langsam werden dürfte...
Gruß
Borlander