Einzelnen Beitrag anzeigen
  #9 (permalink)  
Alt 30.07.2008, 10:29
Benutzerbild von netspy
netspy netspy ist offline
Erfahrener Benutzer
XHTMLforum-Kenner
 
Registriert seit: 13.08.2004
Ort: Leipzig
Beiträge: 1.953
netspy sorgt für eine eindrucksvolle Atmosphärenetspy sorgt für eine eindrucksvolle Atmosphäre
Standard

Zitat:
Zitat von Scheppertreiber Beitrag anzeigen
PDF ist ein ASCII-Format, es ist kein Problem, den Text da herauszulesen und als Textdatei irgendwo abzulegen.
Na ganz so einfach ist es aber nicht. In vielen PDF-Dateien ist der Text gepackt und nicht als Klartext lesbar. Die Textblöcke zu suchen, entpacken und auszulesen ist zwar nicht extrem schwer aber auch nicht ganz einfach. Richtig mistig wird es, wenn man mit OOo erstellte PDFs hat, die haben gar keinen zusammenhängenden Text mehr, da dort (vermutlich wegen dem Kernig) jeder Buchstabe einzeln abgelegt ist.

Mario
__________________
AppDev Blog · AppDev Forum
Mit Zitat antworten
Sponsored Links