PDF-Recherche

Online Recherche Werkzeug für PDF-Dokumente (z.B. Studium, Vorlesungsfolien, Skripte, eBooks), welches das wissenschaftliche Arbeiten, Studium und Forschen auf einem riesigen Dokumentenbestand in Form von PDF-Dokumenten ermöglicht.

Übersicht
Übersicht
Detailseite
Detailseite
Suche
Suche
Suchtreffer
Suchtreffer
Metadaten
Metadaten
mobile Ansicht
mobile Ansicht
mobile Seitenansicht
mobile Seitenansicht
Webseite
https://www.pdf-recherche.de

Tätigkeit

Upload der PDF-Dokumente per lokaler Dateiauswahl-Dialog oder remote per URL

Zerlegung der PDF-Dokumente in Einzelseiten

Extrahierung des Textes auf jeder Dokumentseite

Indizierung der Textseiten für Volltext-Searchengine

Speicherung der Texte und PDF-Daten in einer relationalen Datenbank (Pattern für diese 4 Schritte: Pipes und Filter)

Benutzeranmeldung für sicheren Zugriff auf die Dokumente und Trennung des Dokumentenbestandes

Automatische Generierung der Dokument-Metadaten (Autor, Verlag, Veröffentlichung, Beschreibung) durch API-Zugriff auf Google-Books

Responsive Design für unterschiedliche Displaygrößen

Rolle
Projektleiter, Entwickler, Administrator
Kompetenzen
HTML / CSS / JavaScript, Ruby, Ruby on Rails, Apache Solr, jQuery, MySQL
Referenzen
st@eding
Zeitraum
2017, 2020
Standorte
Cottbus
Werkzeuge

Rubymine, DataGrip

Funktionsumfang

  • browserbasiertes PDF Recherche Tool ermöglicht eine Volltextsuche über kompletten Dokumentenbestand
  • Suche in ausgewählten einzelnen PDF-Dokumenten
  • zentraler Speicher-Ort für PDF-Dokumente, die von überall im Internet erreichbar sind (Client Server Architektur)
  • Anzeige der PDF-Seiten auf allen Geräten mit einem aktuellen Webbrowser, z.B. Tablet, Smartphone, Desktop-Rechner
  • Markierung des Suchbegriffes in der Seitenansicht der relevanten Dokumente
  • Auswahl der Dokumente über Taxonomy wie Verlag, Thema, Ranking, Format
  • Einschränkung der Suchergebnisse über Taxonomy-Filter und per User
  • Download der originalen PDF-Dokumente zum Offline-Lesen
  • Import der Metadaten (Titel, ISBN, Verlag, Autor, Sprache, Bewertung) über Google Books API-Zugriff
  • Unterstützung zum Zitieren aus Dokumenten
  • Zugriffsrechte steuern Sichtbarkeit der Dokumente für mehrere Benutzer und öffentlichen Bereich

Vorteile

  • Unabhängigkeit von kommerziellen Anbietern(z.B.Adobe), Tools und Cloud-Diensten
  • basiert vollständig auf Open Source Technologien
  • extrem schnelle Volltextsuche durch Vorverarbeitung und Indizierung des Dokumentenbestandes
  • schnelle Ladezeiten, da nur Einzel-Seiten vom Server zur Anzeige heruntergeladen werden
  • gesamter Dokumentenbestand jederzeit und überall auf allen Geräten verfügbar (Internet vorausgesetzt) 
  • einfache Erstellung von Zitaten, durch kopieren von Text und Meta-Daten
Änderungen

01/20 öffentlich zugänglichen Bereich ohne Benutzer-Login hinzugefügt
03/17 Erster Prototyp für Studium speziell zur Verwaltung und Recherche von Studienunterlagen