Skip to main content

9.9.2021 - PubEngine Text Extraktion mit zahlreichen Verbesserungen

Für die Volltextsuche in PDF Dokumenten verfügt die PubEngine eLibrary Plattform über eine leistungsstarke Text Extraktion, die jetzt in vielen Punkten weiter verbessert wurde. Die Text Extraktion ist essenziell, um Volltextsuche und Text Mining Anwendungen überhaupt erst zu ermöglichen und auf das allerhöchste Level zu heben.

Neuerungen Text Extraktion

- natives Unicode

- noch höhere Verarbeitungsgeschwindigkeit

- Optimierung der Erkennung von Wort-, Satz- und Absatzgrenzen

- Besseres Handling mit problematischen PDF Dokumenten

- Fixes und Security Updates.

Über PubEngine

Die PubEngine ist die ePublishing Plattform für das Publizieren und Vermarkten (wissenschaftlicher) digitaler Inhalte. Für Hochschul- und Bibliothekskunden bietet die PubEngine spezielle eLibrary Funktionen wie COUNTER Statistiken, Link Resolver, OpenURL, DOI, OCLC Anbindung  oder ein eigenes Dashboard für den Institutions-Administrator. 

Die PubEngine ist von Grund auf neu und federleicht. Enterprise NoSQL bietet maximale Flexibilität. Intelligente Suche und Navigation garantieren hohe Kundenzufriedenheit und -loyalität. Das HTML Framework sorgt für Responsive Design auf allen Kanälen.