Das Angebot gesprochener Audioinhalte steigt rasant: Hörbücher, Hörspiele aber auch Podcasts, Bildungsinhalte Radioreportagen, gesprochene Inhalte von Printmedien und nicht zuletzt filmische Inhalte von der Talkshow über Dokus bis hin zu Spielfilmen basieren auf gesprochenen Audioinhalten.
Was verrät die menschliche Stimme über den Inhalt eines Audiowerks? Kann Künstliche Intelligenz (KI) bestimmen, ob ein Text spannend, beruhigend oder emotional ist? Mit diesen Fragen beschäftigt sich seit fast zwei Jahren das Leipziger Forschungsprojekt MANGAN, gefördert vom Bundesministerium für Bildung und Forschung im Rahmen des Programms KMU-innovativ. Ziel ist, eine intuitive Suchfunktion für das Internetportal vorleser.net zu entwickeln, die Hörer:innen nicht nur nach Genres, sondern auch nach Stimmung und emotionaler Wirkung suchen lässt. An dem Projekt sind der Hörbuchverlag BUCHFUNK, das Universitätsrechenzentrum der Universität Leipzig und die Digitalagentur ifabrik beteiligt.
Die Inhalte müssen den Nutzern zugänglich gemacht und vor allem von diesen gefunden werden. Dabei ist eine einfache und präzise Extraktion von Metadaten notwendig, um die Inhalte effektiv und effizient in die Wertschöpfungskette integrieren zu können. Auf der anderen Seite spielen leistungsfähige und intuitive Suchansätze eine immer größere Rolle – insbesondere vor dem Hintergrund einer zunehmenden Individualisierung des Konsums.
Die Ziele des Vorhabens sind zwei zentrale, auf künstlicher Intelligenz (KI) basierende, Innovationsschritte im Bereich gesprochener Audioinhalte:
Eine Nutzerin sucht unbestimmt nach einem Krimi, der nicht zu aufregend ist. Noch muss sie sich mühsam durch Katalog-Bäume hangeln. Mit der KI-basierten MIC-Suche kann sie über Schieberegler „spannend ↔ entspannend“ intuitiv suchen und bekommt so den für sie bestmöglichen Titel vorgeschlagen.
Das Konsortium umfasst drei Partner:innen aus der Leipziger IT-, Medien- und Kreativwirtschaft, welche die Schwerpunkte Anwendung (BUCHFUNK), wissenschaftlich-technische Fragestellungen (URZ der Universität Leipzig) sowie Implementierung (ifabrik) abdecken.
Als assoziierte Partner unterstützen der Argon Verlag, das Streamingportal BookBeat, der Contentaggregator Zebralution, das Deutsche Zentrum für barrierefreies Lesen (DZB), die Buchhandelsgruppe Thalia sowie die MVB als Wirtschaftstochter des Börsenvereins des Deutschen Buchhandels das Konsortium bei der Anforderungserhebung, Evaluation und Verbreitung der Ergebnisse.
Das Projekt wird von 2022 bis 2025 drei Jahre lang vom Bundesministerium für Bildung und Forschung gefördert.