|
|||
![]()
Hallo,
ich brauche eine Suchfunktion für einen etwa 150 Seiten großen Webauftritt, es sind auch PDF-Dateien dabei - wie würdet ihr das machen: selbst programmieren oder auf Fertiges zurückgreifen (FreeFind??) Habt ihr irgendwelche Tipps? (Ich hab so eine Suche schon einmal programmiert und hab es irgendwie in Erinnerung, dass es mit den PDF-Dateien so schwierig war) planet4 |
Sponsored Links |
Sponsored Links |
|
|||
![]() Zitat:
Zitat:
Zitat:
Vielen Dank jedenfalls! planet4. |
|
||||
![]()
Du mußt diese Datenbank ja erstmal erstellen. Bei PDF gibt es die verrücktesten
Möglichkeiten, Text zu speichern. Der ist fast immer codiert. Mittlerweile gibt es auch Scanprogramme die automatisch eine OCE durch den Scan pflügen lassen und die gefundenen Worte im PDF ablegen, ideal um diese dann herauszuziehen. Infoblock: Das PDF-Format besteht aus Datenblöcken, einer davon ist der Info-Block. Erkennbar an zB: Code:
% ------------------------------------------------------------------------ % Info-Block % ------------------------------------------------------------------------ 1 0 obj << /Creator (jdcc::wrtiff.c rel Jun 09 2008 / 09:57:56) /CreationDate (D:20080718142641) /ModDate (D:20080718142641) /Title (Druckversion) /Author (JDCC Steinmark by Joe Drechsel) /Producer (DeCodeTron GmbH) /Subject (Internet Archiv) >> endobj |
|
|||
![]()
also ich hab jetzt mal nachgeschaut:
Für der Suchfunktion hatte ich die Dateien, die durchsucht werden sollten (die Dateinamen) in eine Textdatei geschrieben, die dann ausgelesen wurden und die Dateien durchsucht, PDFs hatte ich zuvor irgendwie umständlich in HTML verwandelt, inzwischen kann ich das einfacher haben: die PDF als Textdatei exportieren. Ich würde auch nicht mehr mit einer Textdatei für die Dateinamen arbeiten, ich würde sie in einer DB aufnehmen. Jetzt ist mir aber gerade noch etwas eingefallen, was es schwierig macht: es gibt eine Seite mit aktuellen Meldungen, diese Meldungen werden aus einer Datenbank gelesen und umfassen mehrere Seiten. Das bedeutet ja, ich müsste die entsprechenden Felder der DB für die Suche mit einbeziehen. Wird z.B. etwas im 15. Eintrag gefunden und dieser Eintrag wird normalerweise auf Seite 5 ausgegeben (aktuelle-meldungen.php?page=5) ... da wird's schwierig, wie soll meine Suche das wissen? - na gut, irgendwie ist das wohl möglich, ich muss die Anzahl der Datensätze wissen und wie viel auf einer Seite ausgegeben werden und dann die Seite errechnen. ![]() planet4 |
![]() |
Themen-Optionen | |
Ansicht | |
|
|
![]() |
||||
Thema | Autor | Forum | Antworten | Letzter Beitrag |
Teile der Website verschieben sich bei Auflösung | Panamajack | (X)HTML | 7 | 19.06.2010 15:53 |
Norwegische Webmaster gegen veraltete Browser | Schelm.isch | Offtopic | 255 | 23.04.2009 22:27 |
analysetool für websites | opa-rudi | Site- und Layoutcheck | 23 | 05.08.2008 15:33 |
Bitte um Feedback zu meiner überarbeiteten Website | Sen-nefer | Site- und Layoutcheck | 9 | 08.02.2008 16:49 |