Ein Scanner liefert doch nur ein Bild(!) der eingelegten Seite und sonst nichts. Ohne eine zusätzliche Texterkennung kann das Scan-Programm auch nur eben dieses Bild in eine PDF packen, denn etwas anderes hat es ja nicht zur Verfügung. Mit einer Texterkennung, die man noch über das eingescannte Bild laufen lässt, kann man einen zusätzlichen Textlayer erzeugen und mit in die PDF packen:
However there are different types of PDF for use when scanning paper-based documents:
• PDF Image Only
• PDF Searchable
PDF Image Only takes a bitmapped image of a document (like a TIF file) and applies a PDF wrapper to that raster image.
PDF Searchable Image is a PDF Image Only document with the addition of a text layer beneath the image.
http://www.alliancegroup.co.uk/pdf-searchable-images.htm
Nur in diesem Textlayer befindet sich dann Text, den die Google-Seite, wenn überhaupt, übersetzen könnte.
Man braucht also das PDF-File nicht nochmal wieder in Text umwandeln,
Das meinte ich auch nicht. Was ich meinte war: Man muss schon beim Erzeugen der PDF aus eingescannten Seiten einen solchen zusätzlichen Textlayer mit anlegen.