B.I.T Online berichtet über PubEngine Text to Speech Engine
Text to Speech im Einsatz bei Klett-Cotta eLibrary
b.i.t.online, das Fachmagazin für die „Entscheidungsträger“ in der Bibliothekswelt, berichtet über die PubEngine Text to Speech Engine in seiner Ausgabe 6/2023 anlässlich der Frankfurter Buchmesse:
Text to Speech (TTS) hat in den letzten Jahren erstaunliche Fortschritte gemacht. Neuronale Netze ermöglichen Deep-Learning-Verfahren, um auch komplexe Textstrukturen in Sprache umgewandelt als Audiodatei auf Webseiten bereitstellen zu können. Die Weitkämper Technology GmbH, Seehausen am Staffelsee, hat TTS in ihre E-Publishing-Plattform PubEngine integriert. Mit der neuen Technologie können digitale Zeitschriftenartikel vollautomatisch in Sprache umgewandelt und als Audiodateien auf der Webseite bereitgestellt werden. Die Beiträge kann man dann je nach Wunsch entweder lesen oder anhören.
Als eine der ersten Anwendungen vertont der Verlag Klett-Cotta die Artikel seiner Fachzeitschrift PSYCHE. Der Prozess ist vollständig automatisiert. Bei jedem Hochladen einer Ausgabe in die Klett-Cotta eLibrary auf der Pub Engine werden die Artikel gleichzeitig vollautomatisch als Audiodateien aufbereitet.
Die Hörvariante wird neben dem Lese-PDF zum Download angeboten. Das Audioangebot für die Beiträge in der PSYCHE ist nach Auskunft von Thomas Kleffner, Leiter Zeitschriften bei Klett-Cotta, so gut bei den Kunden angekommen, dass Klett-Cotta jetzt TTS für weitere seiner Zeitschriften nutzen will. Als nächstes soll die Zeitschrift Musik & Ästhetik vollautomatisch um die Audioausgabe ergänzt werden.
Hier geht es zum originalen Artikel
Über PubEngine Text to Speech (TTS) Engine: PubEngine TTS nutzt KI Verfahren wie Neuronale Netze und ermöglicht Deep-Learning Verfahren, um auch aus komplexen Textstrukturen verblüffend lebensechte Sprache zu erzeugen.
Die PubEngine bietet einen vollautmatischen Prozeß, um aus jedem hochgeladenen Zeitschriftenartikel des Verlags einen Podcast zu erstellen und den Kunden in der PubEngine eLibrary zusätzlich zum Text anzubieten. Das Sprachmodell wird automatisch kontinuierlich verbessert. Es ist kein zusätzlicher Arbeitsschritt seitens des Verlags notwendig, die Vertonung des Artikels und Bereitstellung der Audio Datei in der eLibrary geschieht durch die PubEngine vollständig automatisiert im Hintergrund. Der Verlag kann phonetische Regeln für unbekanntes Fachvokabular in einem Lexikon hinterlegen, das dann für alle Inhalte herangezogen wird.
Hören Sie hier ein Beispiel direkt aus der Klett-Cotta eLibrary (Free Content): Sedlacek, Stefanie; Will, Herbert (2023) Spielarten der Praxis. Psyche, 2023, 77. Jg., Heft 9/10, S. 761
Über b.i.t.online: b.i.t.online ist das Fachmagazin für die „Entscheidungsträger“ in der Bibliothekswelt. Mit über 80.000 Zugriffen pro Monat und ca.12.000 Lesern bedient b.i.t.online die Bibliothekswelt auf seiner Online-Plattform unter www.b-i-t-online.de individuell und exklusiv. b.i.t.online liegt im Ranking ganz oben bei den bibliothekarischen Fachzeitschriften. Es bietet aktuelle und wissenschaftlich unterlegte Informationen für die Branche. Hierbei steht der Anbieter, nämlich die Bibliothek, im Vordergrund. Reportagen, Interviews, Nachrichtenbeiträge und Rezensionen
interessanter Titel bieten dem Leser ein breites Spektrum an Informationen.