Linux 15.010 Themen, 106.838 Beiträge

Deduplikation

weichwurst / 10 Antworten / Flachansicht Nickles

Ich würde mich in meinem Urlaub gern etwas intensiver mit Deduplikation unter Linux beschäftigen und bin (außer auf Git und den rsync-Hardlink-Geschichten) auf das "lessfs" gestoßen: http://www.linuxjournal.com/content/data-deduplication-linux . Hat jemand der versierteren Foristen sich vielleicht einmal mit dem "lessfs" beschäftigt und als zuverlässig genug für ein reines Datengrab befunden?

Hinweise auf Alternativen werden natürlich gern entgegengenommen :-)

bei Antwort benachrichtigen
Borlander weichwurst „Wenn dein Englisch leidlich funktioniert, ist dieser...“
Optionen
Ist kein wirklich kompliziertes Feature, es soll eben Platz sparen.

Jein. Wenn man maximal Platz sparen will dann reicht es auch nicht auf Basis von Dateisystemsektoren zu deduplizieren (auch das würde ich schon nicht als unkompliziert bezeichnen!). z.B. reicht es bei identischen eMail an mehrere Empfänger schon aus wenn sich die Länge des Headers minimal unterscheidet um vollkommen unterschiedliche Sektoren zu produzieren. Das ist dann aber vielleicht auch eine Deduplizierung die man besser erst mit Verzögerung durchführt weil es sonst wirklich langsam werden dürfte...

Gruß
Borlander

bei Antwort benachrichtigen