Kennt jemand eine SiteSearchEngine (wie Crawl-it) die auch .pdf files auf einer eigenen Site indexiert?
Ich würde das File gern in das Durchsuchen meiner Site einbeziehen!
Gibt es da eine Möglichkeit, und wenn ja, wo steht etwas darüber?
Danke
Homepage selbermachen 7.852 Themen, 35.619 Beiträge
Ja, Google macht das. Ist sowieso die beste Suchmaschine. Google.com
Ich denke mal er sucht keine Suchmachine, sondern eine SiteSearchEngine für seine Webseiten!
Letztere findet man auf div. CGI,PERL,PHP Scriptsammelsurium Seiten im Netz, man muß allerdings genau suchen, denn die meisten indexieren halt nur HTML Seiten. Einfach mal bei www.kostenlos.de die Seiten für CGI's durchforsten!
Hoppla... Recht hast du! Ich habe nur "Search" und "PDF" gelesen und dann hab ich schon losgeschrieben wie der Pawlow'sche Hund :-)
Google ist nämlich die erste "Internet-Suchmaschine", die auch PDF-Files indexiert. Hat natürlich nichts mit der gesuchten Homepage-Searchengine zu tun. Sorry.
Im Prinzip schon, den Google wird einen ähnlichen Algorithmus verwenden, wie das auf einer Homepage eingesetzt werden kann!
Bei letzterem fällt mir allerdings ein, ich sollte mal vor zwei Jahren eine Anwendung erstellen, die u.a in mehreren PDF-Dokumenten nach Keywords sucht und die Suchergebnisse übersichtlich darstellen sollte! Eine Anfrage bei Adobe ergab dann, das so etwas nur mit einer speziellen Engine von denen möglich ist, die aber pro Jahr 5000$ Lizenzgebühr gekostet hätte, das war dann meinem Kunden zu teuer und das Projekt wurde gecancelt!
Evt. haben ja die Google-Macher so eine Lizenz, oder die Entwickler haben so etwas, selber auf die Beine gestellt! Eine Suche in meinen
einschlägigen Onlinescript-Archiven, brachte jedenfalls keine Ergebnisse für SearchEngines mit PDF-Support!
Vielleicht hat jemand anderes oder der Urposter hier, mehr glück bei der Suche, dann bitte URL hier bekannt machen!
Frank
Leider habe auch ich als "Urposter" nichts gefunden! Es gibt zwar bei Google eine Free SiteSearch Option, die aber eigene pdf nicht indexiert! Tja, ich würde sagen, das wir es aufgeben!
Danke sehr!
Langsam, nicht gleich aufgeben, schau mal hier:
http://www.htdig.org/
einfach mal in der Seite graben, da steht wie man PDF's indexiert,
entweder mit der kostenlosen Lösung, die die dort anbieten oder selber machen mit den dort beschriebenen PerlScript!
Werde mir das mal downloaden und probieren!