Archiv Scanner 1.570 Themen, 3.787 Beiträge

Suche Software für Texterkennung

Anonym (Anonym) / 4 Antworten / Baumansicht Nickles

Hallo,
bin heute das erste Mal auf dem Scannerbrett,weil ich gedacht habe,hier was passendes zu finden.Hier scheint ihr euch ja fast ausschließlich mit Hardwareproblemen herumzuschlagen.Ich habe einen Scanner aus dem Plus-der tuts langsam aber sehr zuverlässig (USB).Nur war da beschissene Software dabei Text Bridge hieß das texterkennungsprogramm.Meine Frage an euch:wenn euer Scanner mal funktioniert,welches Textprogramm benutzt ihr? gibt es Programme,wo man anschließend den Text bearbeiten kann? gibt es überhaupt schon gescheite Software auf diesem Gebiet? Fotos einscannen ist ja eine Super Sache,aber mit einem gescheiten texterkennungsprog kann man sich wahnsinnig Arbeit sparen.Für eure Antworten zu diesen Fragen herzlichen Dank

Herman Munster Anonym (Anonym) „Suche Software für Texterkennung“
Optionen

Wie immer, stets und ständig gilt "JA UND NEIN!"

Ja, man KANN !!!!! bisweilen mkit einem GUTEN OCR-Programm Zeit sparen. KANN! Es hängt alles an der optischen Qualität
des Scanners. Man sollte also schon gut Bescheid wissen, wie man einen guten Scan hinbekommt. So einfach wie im
Prospekt geht es niemals! Reinlegen - Starten - Erkennen - Bingo! HAH! Auch das beste OCR-Programm kann nicht voll
zum Zuge kommen, wenn schon die Papiervorlage mies ist (Tip: sehr häufig geht es besser, wenn man von der betreffenden
Seite zuerst mit einem guten Fotokopierer eine gute Fotokopie erzeugt und die dann scannt). Der Scanner sollte in der
höchst möglichen OPTISCHEN Auflösung betrieben werden, laß bloß die Finger von dem Interpolationsmist!

Ist die Vorlage gut (große Schrift, ca. 12-14 Punkte, Buchstaben mit deutlichem Abstand voneinander, 1a gedruckt,
Vorlage plan, nicht gewölbt [Buch/Zeitschrift], deutlicher Zeilenabstand) ebenso der Scanner und die Texterkennungs
(OCR)-Software (FineReader Pro hat die beste Erkennungsrate, Omnipage kann aber besser das Layout beibehalten),
dann ist es durchaus möglich(!), daß man nicht nacharbeiten muß. Bei der Nachbearbeitung muß man allerdings jeden
Buchstaben einzeln lesen, denn der Fehlerteufel sitzt im Detail eines Details. So kann aus einem i ein l werden, aus einem l
eine 1, ß zu 8 oder B etc etc etc und umgekehrt. Über sowas liest man leicht hinweg, da Erwachsene die Worte an ihrer
Gestalt erkennen. Wir müssen nicht wie Kinder die Buchstaben zusammensetzen und dann fällt ihnen das Wort ein.
Erwachsenen gehen die typischen Scanfehler leicht durch die Lappen.

Übrigens ist es keine Nachteil, wenn das OSR-Programm den Scanner nicht direkt ansprechen kann, über die zum
Scanner gehörende Scansoftware kann man das Ergebnis häufig deutlich verbessern. Dan muß man in eine (z.B. BMP-Datei)
scannen und diese Bildatei dann der OCR-Software zum Fraße vorwerfen. Du wirst sicherlich den Fall erleben, daß Du eine Vorlage
hast, die man völlig problemlos lesen kann, aber das OCR-Programm liefert nur Gekritzel. Für den OCR-Vorgang ist
es in der Regel am besten, wenn man Helligkeit und Kontrast einer Schwarzweiß- oder Graustufenvorlage (keine
farbigen!) so einstellt, daß man vom Ansehen meint, das ist nun eine Spur zu dunkel, dann ist es für einen OCR-Prog
häufig erst genau richtig. Das muß man austüfteln, notfalls mit jedem Blatt einzeln...

Ein wundes Kapitel ist es, wenn man die Textformatierungen der Vorlage (fett, kursiv, Einzüge etc) beibehalten will/muß.
Noch schlimmer ist es, wenn im Text auch noch Grafiken vorkommen. Texte und Grafik sollte man dann einzeln einscannen und in
einem Layoutprogramm wieder zusammenfügen. Geeignet sind HavardGraphics Publisher (ca.100DM), CorelVentura (bei
CorelDRAW 5 oder 6 ne kostenlose Dreingabe, einzeln so 7-800DM), in der teuren Fraktion PageMaker und in der
ganz ganz ganz teuren QuarkExpress. Generell wenig eignen sich die üblichen Textverarbeitungsprogramme, obwohl von denen
im Prospekt Wunderdinge in diesem Zusammenhang behauptet werden. Ist dort in der Regel alles maßlos übertrieben.

Die Art des Scanners, USB, Parallel oder SCSI, ist wurscht. Im Prinzip eignen sich auch schon die preiswertesten Scanner
zum OCRen, aber je besser die optischen Teile des Scanners sind, was auch mit steigendem Preis einhergeht, desto
weniger Nachbearbeitung ist erforderlich. Nicht umsonst kosten echte professionelle OCR-Maschinen so viel wie ein
preiswertes neues Auto.

Als OCR-Programm empfehle ich FineReader Pro, das die Tage in der 5er Version herausgekommen ist und in
punkto Texterkennung die Konkurrenz anführt - aber auch ´n Batzen Geld kostet (so um und bei 4-500DM). Upgrades
von Vorversionen bei www.softwarehouse.de für 159DM bei Onlinebestellung (30MB Dateigröße).

schwarzerRitter Herman Munster „Wie immer, stets und ständig gilt JA UND NEIN! Ja, man KANN !!!!! bisweilen...“
Optionen

man alter schwede, ich wußte gar nicht ,dass scannen so kompliziert sein kann,kein Wunder das es bei mir mit der textverarbeitung so hapert. ich werde mir das alles in aller ruhe zu gemüte führen und dann mal sehen wie ich weitermache. auf alle fälle herzlichen dank für deine mitteilung

Herman Munster (Anonym) schwarzerRitter „man alter schwede, ich wußte gar nicht ,dass scannen so kompliziert sein...“
Optionen

EINFACH UND PROBLEMLOS - das gibt es NUR im Prospekt.

Normalerweise ist ja auch alles einfach, so ein bißchen, einigermaßen, aber nicht immer.

(Anonym) Anonym (Anonym) „Suche Software für Texterkennung“
Optionen

Super und sogar kostenlos ist Omnipage 9.0 von Caere-Software. Schau mal bei WWW.PC-Magazin.de nach!