zurück zur Startseite
  


Zurück XHTMLforum > Webentwicklung (außer XHTML und CSS) > Serveradministration und serverseitige Scripte
Seite neu laden Suchfunktion für Website

Antwort
 
LinkBack Themen-Optionen Ansicht
  #1 (permalink)  
Alt 19.07.2008, 08:35
Benutzer
neuer user
Thread-Ersteller
 
Registriert seit: 17.05.2007
Ort: Regensburg
Beiträge: 65
planet4 befindet sich auf einem aufstrebenden Ast
Standard Suchfunktion für Website

Hallo,
ich brauche eine Suchfunktion für einen etwa 150 Seiten großen Webauftritt, es sind auch PDF-Dateien dabei - wie würdet ihr das machen: selbst programmieren oder auf Fertiges zurückgreifen (FreeFind??) Habt ihr irgendwelche Tipps?
(Ich hab so eine Suche schon einmal programmiert und hab es irgendwie in Erinnerung, dass es mit den PDF-Dateien so schwierig war)

planet4
Mit Zitat antworten
Sponsored Links
  #2 (permalink)  
Alt 19.07.2008, 09:19
Benutzerbild von Scheppertreiber
Chaot und Nonkonformist.
XHTMLforum-Kenner
 
Registriert seit: 13.03.2007
Ort: Steinmark im Spessart
Beiträge: 7.458
Scheppertreiber ist ein LichtblickScheppertreiber ist ein LichtblickScheppertreiber ist ein LichtblickScheppertreiber ist ein LichtblickScheppertreiber ist ein Lichtblick
Standard

Servus,

die PDFs auswerten ist nicht so tragisch, da gibt es Tools die die Texte
rausziehen. Problematisch ist es dann eher das gefundene Wort auf Seite 93
links unten anzuzeigen bzw zu markieren.

Das bekomme ich nur hin wenn ich die PDFs selbst erstelle, meines Wissens
läßt sich der Reader nicht auf diese Art steuern. Wenn die PDFs nur eine Seite
haben ist das unproblematisch. Im Notfall kann der User immer noch die im
Reader eingebaute Suchfunktion verwenden.

Vielleicht reicht es für die Website ja auch die Infoblöcke der PDFs anzuzeigen.

Bei der Trefferanzeige in einer HTML-Seite würde ich das parsen und den
gefundenen Treffern ein <span> mit einer Klasse verpassen die das quietschgelb
mit roten Punkten markiert. Bei Textdateien würde ich ebenso verfahren.

In jedem Fall eine kleine Datenbank mit den Schlagworten und den Dateien
erstellen, anhand der Extension (zb bei Windows) oder einem Dateityp dann
die Datei parsen und dabei absenden.
__________________
Grüße aus dem Spessart, Joe

{ table-layout: biertischistbesser; }
Der Mausinator
Mit Zitat antworten
Sponsored Links
  #3 (permalink)  
Alt 19.07.2008, 10:21
Benutzer
neuer user
Thread-Ersteller
 
Registriert seit: 17.05.2007
Ort: Regensburg
Beiträge: 65
planet4 befindet sich auf einem aufstrebenden Ast
Standard

Zitat:
Zitat von Scheppertreiber Beitrag anzeigen
Problematisch ist es dann eher das gefundene Wort auf Seite 93 links unten anzuzeigen bzw zu markieren.
Ja, darüber hab ich auch schon nachgedacht, aber das wäre zweitrangig. Die PDFs sind fast alle 4-6 Seiten lang, dann müssten die Leute eben selbst nach dem Wort suchen.

Zitat:
Zitat von Scheppertreiber Beitrag anzeigen
Vielleicht reicht es für die Website ja auch die Infoblöcke der PDFs anzuzeigen.
Was meinst du damit?

Zitat:
Zitat von Scheppertreiber Beitrag anzeigen
In jedem Fall eine kleine Datenbank mit den Schlagworten und den Dateien erstellen, anhand der Extension (zb bei Windows) oder einem Dateityp dann die Datei parsen und dabei absenden.
Das versteh ich nicht so ganz: meinst du, es sollte dann nur in der DB nach Schlagwörtern gesucht werden? Bei der Suche, die ich mal programmiert hab, hab ich jeweils die ganzen Dateien durchsuchen lassen, da war es dann aber auch möglich, jedes Wort, dass länger als 3 Zeichen war, zu finden, also nicht nur bestimmte, aussagekräftige Schlagwörter.

Vielen Dank jedenfalls!
planet4.
Mit Zitat antworten
  #4 (permalink)  
Alt 19.07.2008, 11:08
Benutzerbild von Scheppertreiber
Chaot und Nonkonformist.
XHTMLforum-Kenner
 
Registriert seit: 13.03.2007
Ort: Steinmark im Spessart
Beiträge: 7.458
Scheppertreiber ist ein LichtblickScheppertreiber ist ein LichtblickScheppertreiber ist ein LichtblickScheppertreiber ist ein LichtblickScheppertreiber ist ein Lichtblick
Standard

Du mußt diese Datenbank ja erstmal erstellen. Bei PDF gibt es die verrücktesten
Möglichkeiten, Text zu speichern. Der ist fast immer codiert.

Mittlerweile gibt es auch Scanprogramme die automatisch eine OCE durch den
Scan pflügen lassen und die gefundenen Worte im PDF ablegen, ideal um diese
dann herauszuziehen.

Infoblock:

Das PDF-Format besteht aus Datenblöcken, einer davon ist der Info-Block.
Erkennbar an zB:
Code:
% ------------------------------------------------------------------------
% Info-Block
% ------------------------------------------------------------------------

1 0 obj
  <<
  /Creator      (jdcc::wrtiff.c rel Jun 09 2008 / 09:57:56)
  /CreationDate (D:20080718142641)
  /ModDate      (D:20080718142641)
  /Title        (Druckversion)
  /Author       (JDCC Steinmark by Joe Drechsel)
  /Producer     (DeCodeTron GmbH)
  /Subject      (Internet Archiv)
  >>
endobj
Als (fast) reines ASCII-Format läßt sich PDF wunderbar parsen.
__________________
Grüße aus dem Spessart, Joe

{ table-layout: biertischistbesser; }
Der Mausinator
Mit Zitat antworten
  #5 (permalink)  
Alt 19.07.2008, 12:59
Benutzer
neuer user
Thread-Ersteller
 
Registriert seit: 17.05.2007
Ort: Regensburg
Beiträge: 65
planet4 befindet sich auf einem aufstrebenden Ast
Standard

also ich hab jetzt mal nachgeschaut:
Für der Suchfunktion hatte ich die Dateien, die durchsucht werden sollten (die Dateinamen) in eine Textdatei geschrieben, die dann ausgelesen wurden und die Dateien durchsucht, PDFs hatte ich zuvor irgendwie umständlich in HTML verwandelt, inzwischen kann ich das einfacher haben: die PDF als Textdatei exportieren. Ich würde auch nicht mehr mit einer Textdatei für die Dateinamen arbeiten, ich würde sie in einer DB aufnehmen.

Jetzt ist mir aber gerade noch etwas eingefallen, was es schwierig macht:
es gibt eine Seite mit aktuellen Meldungen, diese Meldungen werden aus einer Datenbank gelesen und umfassen mehrere Seiten. Das bedeutet ja, ich müsste die entsprechenden Felder der DB für die Suche mit einbeziehen. Wird z.B. etwas im 15. Eintrag gefunden und dieser Eintrag wird normalerweise auf Seite 5 ausgegeben (aktuelle-meldungen.php?page=5) ... da wird's schwierig, wie soll meine Suche das wissen? - na gut, irgendwie ist das wohl möglich, ich muss die Anzahl der Datensätze wissen und wie viel auf einer Seite ausgegeben werden und dann die Seite errechnen.

planet4
Mit Zitat antworten
Antwort

Themen-Optionen
Ansicht

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus


Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Teile der Website verschieben sich bei Auflösung Panamajack (X)HTML 7 19.06.2010 14:53
Norwegische Webmaster gegen veraltete Browser Schelm.isch Offtopic 255 23.04.2009 21:27
analysetool für websites opa-rudi Site- und Layoutcheck 23 05.08.2008 14:33
Bitte um Feedback zu meiner überarbeiteten Website Sen-nefer Site- und Layoutcheck 9 08.02.2008 15:49


Alle Zeitangaben in WEZ +2. Es ist jetzt 11:20 Uhr.