PDF-Recherche
- Webseite
- https://www.pdf-recherche.de
- Tätigkeit
Upload der PDF-Dokumente per lokaler Dateiauswahl-Dialog oder remote per URL
Zerlegung der PDF-Dokumente in Einzelseiten
Extrahierung des Textes auf jeder Dokumentseite
Indizierung der Textseiten für Volltext-Searchengine
Speicherung der Texte und PDF-Daten in einer relationalen Datenbank (Pattern für diese 4 Schritte: Pipes und Filter)
Benutzeranmeldung für sicheren Zugriff auf die Dokumente und Trennung des Dokumentenbestandes
Automatische Generierung der Dokument-Metadaten (Autor, Verlag, Veröffentlichung, Beschreibung) durch API-Zugriff auf Google-Books
Responsive Design für unterschiedliche Displaygrößen
- Rolle
- Projektleiter, Entwickler, Administrator
- Kompetenzen
- HTML / CSS / JavaScript, Ruby, Ruby on Rails, Apache Solr, jQuery, MySQL
- Referenzen
- st@eding
- Zeitraum
- 2017, 2020
- Standorte
- Cottbus
- Werkzeuge
Rubymine, DataGrip
- browserbasiertes PDF Recherche Tool ermöglicht eine Volltextsuche über kompletten Dokumentenbestand
- Suche in ausgewählten einzelnen PDF-Dokumenten
- zentraler Speicher-Ort für PDF-Dokumente, die von überall im Internet erreichbar sind (Client Server Architektur)
- Anzeige der PDF-Seiten auf allen Geräten mit einem aktuellen Webbrowser, z.B. Tablet, Smartphone, Desktop-Rechner
- Markierung des Suchbegriffes in der Seitenansicht der relevanten Dokumente
- Auswahl der Dokumente über Taxonomy wie Verlag, Thema, Ranking, Format
- Einschränkung der Suchergebnisse über Taxonomy-Filter und per User
- Download der originalen PDF-Dokumente zum Offline-Lesen
- Import der Metadaten (Titel, ISBN, Verlag, Autor, Sprache, Bewertung) über Google Books API-Zugriff
- Unterstützung zum Zitieren aus Dokumenten
- Zugriffsrechte steuern Sichtbarkeit der Dokumente für mehrere Benutzer und öffentlichen Bereich
- Unabhängigkeit von kommerziellen Anbietern(z.B.Adobe), Tools und Cloud-Diensten
- basiert vollständig auf Open Source Technologien
- extrem schnelle Volltextsuche durch Vorverarbeitung und Indizierung des Dokumentenbestandes
- schnelle Ladezeiten, da nur Einzel-Seiten vom Server zur Anzeige heruntergeladen werden
- gesamter Dokumentenbestand jederzeit und überall auf allen Geräten verfügbar (Internet vorausgesetzt)
- einfache Erstellung von Zitaten, durch kopieren von Text und Meta-Daten
- Änderungen
01/20 öffentlich zugänglichen Bereich ohne Benutzer-Login hinzugefügt
03/17 Erster Prototyp für Studium speziell zur Verwaltung und Recherche von Studienunterlagen
Online Recherche Werkzeug für PDF-Dokumente (z.B. Studium, Vorlesungsfolien, Skripte, eBooks), welches das wissenschaftliche Arbeiten, Studium und Forschen auf einem riesigen Dokumentenbestand in Form von PDF-Dokumenten ermöglicht.