Dann stellt sich mir die Frage ob Du überhaupt eine Ähnlichkeitssuche brauchst, wenn Du alle Varianten des selben Bildes behalten willst.
Dasselbe Bild in verschiedenen Varianten ist nicht dasselbe Bild! Egal ob Inhalt oder Dateiname.
Falls das exakt selbe Bild einmal mit und einmal mit EXIF-Dateien vorliegt sollen dann beide Dateien erhalten bleiben?
Ja, denn auch das ist nicht dasselbe. Einmal mit Information über Kamera, Objektiv und vieles mehr, ohne Exif eben ohne diese Informationen.
Hab schon mit dem Programm rumprobiert. Bildvergleichssuche geht nicht, da einfach zuviele Dateien. In einem Ordner sind selten gleiche Dateien, Suche sinnlos. Aber in verschiedenen Ordnern und Unterordnern befinden sich gleiche Dateien, zum Teil bis an 5 verschiedenen Orten/Ordnern.
Habe auf einem Raid-Speicher (ArchivA) 1280803 Bilddateien in 40594 Ordnern. Auf einem anderen Speicher(ArchivB) ähnlich viel. Archiv A und Archiv B sollen untereinander ebenso abgeglichen werden. Das Problem, das Dateien umbenannt worden sind, gehe ich nicht an. Da würde nur ein Bildpixelvergleich sinnvoll sein, aber bei der Masse?
Das Programm funktioniert gut, aber es ist ja allein ein Problem der Zugriffszeiten vom Programm. Schneller als die Datenübertragung über eSata oder USB3 geht ja nicht.
Hatte mich zuvor nicht mit Vergleichssoftware beschäftigt. Kann ja nicht Wochenlang vor der Kiste sitzen und händisch Duplikate rauslöschen.
Leider ist das System der Dateinamenbenennung und auch die Ordnerstruktur über Jahrzente nicht gleich erfolgt. Eine Verschlagwortung hat auch aufgrund der Masse nicht stattgefunden. Im Dateiordner steht Ort,Datum,Suffix., aber auch das nicht immer konsequent.
Ganz schön schwieriges Projekt für mich. Gruß Roger