Nickles › Forum › Software › Anwendungs-Software und Apps

Anwendungs-Software und Apps 14.502 Themen, 73.751 Beiträge

Buchseiten digitalisieren

Winfried8 am 12.01.2012, 16:35 / 29 Antworten / Flachansicht

Hallo Freunde,
für einen Bekannten möchte ich einen Reiseführer von 1892 digitalisieren.Soll heißen: Seite für Seite einscannen und in ein Format bringen,womit man dann,ähnlich einer Diashow, Seite für Seite öffnen kann.Noch besser wäre,wenn man gezielt die Seite z.B. Nr.127 öffnen könnte.Ich verwende Windows 7 Home Premium 64 Bit.Man bräuchte dazu ein Text-Erkennungsprogramm? Habe ich aber nicht.
Bitte auch dazu einen Hinweis.
Besten Dank im voraus.
Gruß Winfried8

      Hallo Winfried, Warum verwendest du nicht einfach das pdf Format? Das Geht ... Hebbe1 12.01.2012, 18:04
    
      Danke Hebbe1, Du bist ja richtig schnell mit der ersten Antwort.PDF-Format ... Winfried8 12.01.2012, 18:54
    
      Das der nur .jpg kann, glaube ich dir jetzt nicht selbst die billigsten ... Hebbe1 12.01.2012, 19:21
    
      Winfried8 Winfried8 12.01.2012, 19:49
    
      Aber mein Scanner gibt die Datei im Bildformat .jpg aus. JPG ist aufgrund ... mawe2 12.01.2012, 20:00
    
      Ich würde mal folgenden Weg vorschlagen: Eignen tut sich dafür das ... andy11 12.01.2012, 18:09
    
      Auch Dir, lieber Andy11,sage ich herzlich Dank. Du nennst ja auch das ... Winfried8 12.01.2012, 19:03
    
      Hallo, eine OCR Software für Texterkennung ist nicht zwingend nötig. Ich ... Jörg63 12.01.2012, 18:48
    
      Hallo Jörg, danke für Deinen Beitrag.Irfan View und Foxit Reader sind auf ... Winfried8 12.01.2012, 19:08
    
      Wenn es sich um ein wertvolles Buch handelt, brauchst Du einen Buchscanner. ... mawe2 12.01.2012, 18:53
    
      Hallo mave2, auch Dir gillt mein Dank für Deine Ausführungen. Es ist kein ... Winfried8 12.01.2012, 19:24
    
      Wenn man hauptsächlich den Text braucht bzw. wenn der Text editierbar sein ... Hebbe1 12.01.2012, 20:00
    
      Glaubst du wirklich , das es mit OCE klappen könnte OCR!! Das geht schon. ... mawe2 12.01.2012, 20:59
    
      Hallo Winfried8! Ich habe selber schon einige Bücher mit 200 und mehr ... BSG1981 12.01.2012, 23:46
    
      Hallo Winfried8, wenn du durchsuchbare Texte willst, kann ich mich nur der ... PeterP1 13.01.2012, 09:51
    
      Winfried8 Winfried8 13.01.2012, 10:53
    
      Hallo, BSG1981 schrieb: Ausgabeformat: Um sich alle Optionen für eine ... Jörg63 13.01.2012, 18:41
    
      Hallo Jörg, Du hast schon recht:das Pdf-Format ist richtig und ich verwende ... Winfried8 13.01.2012, 19:43
    
      Hallo Monika, also, ich bin mal Deinem Pfad gefolgt und habe heute mit ... Winfried8 13.01.2012, 18:57
    
        Jörg63 Winfried8 „Hallo Monika, also, ich bin mal Deinem Pfad gefolgt und habe heute mit meinem...“
      
        13.01.2012, 20:49 Optionen
      
          Hallo,

          hier einen Link zum TIFF Format: http://de.wikipedia.org/wiki/Tagged_Image_File_Format

          Das Zitat Das Tagged Image File Format (TIFF oder auch kurz TIF) ist ein Dateiformat zur Speicherung von Bilddaten dürfte klären, warum es sich nicht für durchsuchbaren Text eignet.

          Das BSDG1981 einmal eine nur mit einem Scanner erstellte Bilddatei im PDF Format, richtig als nicht für durchsuchbar angibt, aber andererseits das TIFF Format als geeignetes Ausgabeformat erklärt, erschließt sich mir nicht.

          Grundlage für ausgelesenen Text aus einm Scanvorgang ist eine OCR Software, deren Ausgabeformate sind.: JPG, TIFF, PDF, WORD, und andere. JPG und TIFF sind Bildformate, die aus Pixeln bestehen. Word und PDF können Text und Bilder enthalten. Durchsuchbar nach Text sind somit nur Word und PDF.

          Ich bin mir nicht sicher, ob eine OCR Software nach dem Einlesen des Textes, das Ergebnis direkt als Text in eine PDF Datei schreiben kann, oder ob das Ergebnis als Bild in eine PDF Datei eingebettet wird. Das würde allerdings den OCR Scan nach Text sinnlos machen. Denn dann wäre das Ergebnis tatsächlich nicht durchlesbar.

          Aber vielleicht macht die ein oder andere OCR Software beim Erstellen einer PDF Datei nicht anderes, als ein PDF Druckertreiber. in Word. Der Text wird innerhalb einer PDF Datei nicht als Pixel, sondern als Text behandelt.

          Denn wenn man eine Word Datei mittels "Datei, drucken, Auswahl: PDF Drucker" in ein PDF Format umwandelt, dann ist diese jedenfalls mit einem PDF Reader durchsuchbar.

          Könnte man die Doppelseiten auch im PDF-Format mit Deinem Vorschlag scantailor.sourceforge.net trennen oder geht das nur im TIFF-Format?

          Für das PDF Format würde ich, wie bereits erwähnt PDF Split and Merge ("teilen und zusammenfügen") (Freeware: deutsch) (http://www.chip.de/downloads/PDF-Split-and-Merge_29495960.html) benutzen.

          Gruß

          Jörg

             bei Antwort benachrichtigen
        
      Das BSDG1981 einmal eine nur mit einem Scanner erstellte Bilddatei im PDF ... mawe2 13.01.2012, 21:28
    
      @mehrere meiner Vorschreiber/-inen Hallo alle miteinander! 1. Welche ... BSG1981 14.01.2012, 02:19
    
      Die OCR Software wird nicht extra installiert. Die versteckt sich im ... mawe2 14.01.2012, 21:42
    
      Winfried hat ein Multifunktionsgerät Brother DCP-130C . Diese Drucker haben ... BSG1981 15.01.2012, 02:02
    
      OK, hab s verstanden. Ich benutze für solche Arbeiten immer spezialisierte ... mawe2 15.01.2012, 12:34
    
      Hallo, du schreibst Egal, ob man den Text als BILD oder mittels OCR als TEXT ... Jörg63 14.01.2012, 19:26
    
      das der PDF Druckertreiber, den man z.B in Word integrieren kann, nicht ... mawe2 14.01.2012, 21:38
    
      möchte ich einen Reiseführer von 1892 digitalisieren Ist das Fraktur? ... PeterP1 14.01.2012, 11:51
    
      Du hast doch bestimmt Software für Deinen Scanner. Ich scanne eine Seite ... gelöscht_265507 14.01.2012, 12:48