Hallo Freunde,
für einen Bekannten möchte ich einen Reiseführer von 1892 digitalisieren.Soll heißen: Seite für Seite einscannen und in ein Format bringen,womit man dann,ähnlich einer Diashow, Seite für Seite öffnen kann.Noch besser wäre,wenn man gezielt die Seite z.B. Nr.127 öffnen könnte.Ich verwende Windows 7 Home Premium 64 Bit.Man bräuchte dazu ein Text-Erkennungsprogramm? Habe ich aber nicht.
Bitte auch dazu einen Hinweis.
Besten Dank im voraus.
Gruß Winfried8
Anwendungs-Software und Apps 14.460 Themen, 73.205 Beiträge
Hallo,
du schreibst
Egal, ob man den Text als BILD oder (mittels OCR) als TEXT haben möchte: TIFF ist immer das bevorzugte, qualitativ hochwertige und universell anwendbare Dateiformat für Scanergebnisse. (Ob man später eine PDF, JPG oder sonst was draus macht, ist eine andere Frage.)
eine OCR Software legt einen Scan - das war jedenfalls früher so - erst einmal in ihrem eigenen Format an. Dann kann dieser auch später noch bearbeitet werden.
Ich habe den Text und gefundene Bilder immer direkt ins Word Format transportiert, um später noch Änderungen vornehmen zu können.
Text als TIFF zu speichern macht dann Sinn, wenn das vorhandene Format unbedingt beibehalten werden muss. Das ist evtl. bei Winfried8 und seinem alten Buch eine Lösung. Aber er möchte es ja unbedingt als durchsuchbar anlegen.
>cite>Ein OCR-Programm gibt wohl kaum TIFF oder JPG aus! Das sind Bildformate, die man ja mit OCR gerade vermeiden will. PDF und WORD kommen für eine Ausgabe aus einem OCR-Programm schon eher in Frage.
wie GSG1981 schrieb: Dazu: Wenn man der Brother-Seite glauben darf (http://www.brother.de/g3.cfm/s ... Type/specs) sind die Voraussetzungen sehr gut, denn dein Drucker
a) hat eine OCR Software dabei (sieht man daran, dass er Scan-to-text unterstützt)
b) er unterstützt die Ausgabe-Formate PDF/ TIFF/ JPEG.
scheint das doch der Fall zu sein.
Deswegen habe ich darauf hingewiesen, das für durchlesbaren Text das WORD, oder PDF Format geeignet sind.
Aber vielleicht macht die ein oder andere OCR Software beim Erstellen einer PDF Datei nicht anderes, als ein PDF Druckertreiber. in Word. Der Text wird innerhalb einer PDF Datei nicht als Pixel, sondern als Text behandelt.
Sollte eigentlich nur zeigen, das der PDF Druckertreiber, den man z.B in Word integrieren kann, nicht anderes macht, als eine OCR Software. Nur das der Druckertreiber einen Text und die OCR Software einen Scan verarbeitet.
Das ist ja gerade der Sinn von OCR!
War mir schon klar.
Ich denke, das Winfried8 genügend Hinweise bekommen hat, um erste Versuche zu starten und sich dann für seinen Weg zu entscheiden.
Gruß
Jörg