RAG im Verlagswesen: von der Vision zur praktischen Anwendung

Retrieval Augmented Generation kombiniert KI-Komfort mit verlässlichen Verlagsinhalten – und eröffnet neue Geschäftsmodelle. Ein Überblick über Technologie, Einsatzmöglichkeiten und organisatorische Herausforderungen

Published: 14.4.2026

Künstliche Intelligenz ist in Verlagen angekommen. Doch wie lässt sich KI rechtssicher, qualitätsbewusst und zukunftsfähig einsetzen? RAG-Systeme (Retrieval Augmented Generation) bieten vor allem Fachinformationsverlagen eine Antwort: Sie verbinden den Komfort von Chatbots mit der Verlässlichkeit kuratierter Verlagsinhalte – und schaffen damit die Basis für eine Vielzahl neuer digitaler Geschäftsmodelle.

Die Digital-Konferenz „Retrieval-Augmented Generation: Quellenbasierte Antworten statt Black-Box-KI“, veranstaltet vom DIGITAL PUBLISHING REPORT  und unterstützt von Fabasoft Xpublisher, brachte Expert:innen aus Beratung, Technologie und Verlagspraxis zusammen. Carsten Schwab (XPS AG), Anja Paquin (Publisher Consultants), Detlef Büttner (Negative Space), Raphael Baier (Fabasoft Xpublisher) und Hendrik Morr (Argestes Managementberatung) beleuchteten die Technologie und gaben praxisbezogene Livedemos und Impulse aus unterschiedlichen Perspektiven.

Die Konkretheit ihrer Ausführungen erlaubt es Verlagsmitarbeiter:innen, den Aufwand und den Nutzen ihrer individuellen Wege zu RAG Schritt für Schritt einzuschätzen und damit hinsichtlich ihrer Strategiebildung ein Stück weit Autarkie zu gewinnen. Diese Besonderheit ist der Hauptinhalt dieses Beitrags.

Zentrale Erkenntnis: Wenn’s auf Perfektion ankommt, bleiben Verlage unverzichtbar

Carsten Schwab, erfahrener Verlags-„Hase“ (C.H. Beck, S. Fischer, Diogenes, Edupartner), eröffnete provokant: „Wozu brauchen wir überhaupt noch Verlage?“ Und er selbst gab die Antwort: Immer dann, wenn 99,9 % nicht reichen, wenn Antworten 100 % belastbar sein müssen – in der Medizin, im Ingenieurwesen, vor Gericht – reichen kostenlose Angebote nicht aus. Verlage schaffen durch kuratierte, geprüfte Inhalte eine verlässliche Wissensbasis. RAG-Systeme kombinieren diese Verlässlichkeit mit dem Komfort dialogischer Wissensabfrage.

Funktionsweise von RAG-Systemen in drei Schritten:

  1. Retrieve: Durchsuchen der eigenen Inhaltsdatenbank nach relevanten Informationen

  2. Augment: Zusammenstellung des Kontexts aus gefundenen Inhalten

  3. Generate: Formulierung einer natürlichsprachlichen Antwort durch das Large Language Model

Entscheidend: Das LLM arbeitet in einem geschlossenen System, isoliert von unkontrollierten Internetinhalten. Die Antworten basieren ausschließlich auf den kuratierten Verlagsinhalten.

Datenqualität als Erfolgsfaktor

Die technischen Komponenten – Vektordatenbanken, Embeddings, LLMs – sind leicht verfügbar. Der Wettbewerbsvorteil entscheidet sich an der Datenqualität. Schwab betonte, gut strukturierte Inhalte seien besonders wertvoll. Komplexe Elemente wie Fußnoten, Tabellen oder Querverweise müssen allerdings maschinenlesbar aufbereitet werden. Metadaten erhöhen die Antwortqualität erheblich.

Hendrik Morr demonstrierte live und in Echtzeit, wie sich in 15 Minuten mit der deutschen Open-Source-Workflow-Automatisierungsplattform n8n ein funktionsfähiger RAG-Prototyp aufbauen lässt – inklusive Dokumenten-Upload, Vektorisierung und Chat-Interface. Sein Fazit: „Das Spannende ist, dass auch Verlagsmitarbeiter:innen Verständnis für die Komponenten entwickeln und an den Stellschrauben drehen können.“

- Anzeige -

Newsletter-Banner_Xpublisher_2000x694

Geschäftsmodelle: Drei Grundszenarien

Die IG Digital im Börsenverein des Deutschen Buchhandels unterscheidet drei grundlegende Entwicklungsansätze, mit denen Verlage zu RAG-Systemen kommen:

  1. Ergänzung bestehender Angebote: Fachportale erhalten einen Chatbot (Beispiel: Haufe Co-Pilot Tax)

  2. Hybride Produkte: KI-Funktionen reichern klassische Publikationen an (Beispiel: Cornelsen AI unterstützt Lehrkräfte bei der Unterrichtsvorbereitung)

  3. Neue Geschäftsmodelle: Content verschwindet von der Oberfläche und wird nur noch über KI zugänglich (Beispiel: Plastics AI vom Hanser Fachverlag)

Erfolgsfaktor: Das RAG-System muss ein konkretes Kundenproblem lösen. Je spezifischer und spezialisierter, desto höher die Zahlungsbereitschaft der Anwender:innen.

Organisatorische Herausforderungen

Anja Paquin warnt vor planlosem Vorgehen auf der Grundlage von Wunschdenken: Die Frage nach dem konkreten Mehrwert werde oft vorschnell bejaht. Ihre Empfehlungen zur Validierung von RAG-Geschäftsmodellen:

  1. Interdisziplinäre Projektteams von Tag eins

  2. Strategische Einbettung statt technischer Spielerei

  3. Frühzeitige Einbindung von Kund:innen zur Validierung

Die Offenheit gegenüber KI variiert stark. Eine Umfrage Paquins zeigte: Die Haltung in Verlagen ist nicht so durchgehend positiv, wie erforderlich wäre, um den Wandel in der nötigen Geschwindigkeit herbeizuführen.

Detlef Büttner betonte ergänzend, dass RAG einen großen Impact nach innen, in die einzelnen Verlage hinein haben kann, der über die einzelnen Projekte weit hinausgeht. Denn durch die Zusammenführung bisher getrennter Datensilos können neue Produktideen und effizientere Prozesse entstehen. Seine Vision gipfelte in der Idee, dass Verlage zu offenen Wissensplattformen werden, die von Nutzern in deren eigene Systeme integriert werden.

Technologie-Integration: Der Fabasoft-Ansatz

Raphael Baier demonstrierte am praktischen Beispiel, wie moderne Redaktionssysteme KI zentral integrieren – ohne Tool-Wildwuchs. Xpublisher bietet einen integrierten AI-Core für:

  1. KI-gestützte Recherche: Zeitersparnis je nach organisatorischen Rahmenbedingungen und individueller Ausgangslage bis 70 %. Dieser und alle weiteren dargestellten Werte basieren auf Annahmen und Erfahrungswerten. Die tatsächliche Zeitersparnis und der tatsächliche Zeitaufwand können abweichen.

  2. durch kontextbasierte Antworten aus dem gesamten Content-Bestand

  3. Automatisierte Übersetzung: 75 % Zeitersparnis bei Wahrung der XML-Struktur und Terminologie. Auch hier können wie überall tatsächliche Zeitersparnis und Zeitaufwand je nach konkreten Verhältnissen abweichen.

  4. Content-Assistenz: 80 % Zeitersparnis bei der Erstellung von Teasern und Social-Media-Texten

  5. Bildanalyse: 90 % Zeitersparnis bei der Verschlagwortung und Erstellung von Alt-Texten für Barrierefreiheit

Baier betonte, der „Human in the Loop“ werde auf absehbare Zeit nicht von der Bildfläche verschwinden. Die Qualitätssicherung bleibt bei Expert:innen – aber die Prozesse werden schlanker. Früher war Kontrolle an jedem Arbeitsschritt nötig, heute reicht oft die Sichtung des Gesamtergebnisses.

Datenschutz und digitale Souveränität

Besonders in sicherheitsrelevanten Kontexten ist es nicht gleichgültig, wo Verlagsdaten gehostet werden. Auch dies ist ein mögliches Auswahlkriterium.

Xpublisher zum Beispiel gibt an, alle Daten in europäischen Rechenzentren (Deutschland, Österreich, Schweiz) zu speichern, und ist nach höchsten Standards zertifiziert. Das Europäische Parlament nutzt das System aufgrund dieser digitalen Souveränität.

Für wen lohnt sich RAG?

Theoretisch lassen sich Daten aller Wissensdomänen und überhaupt Verlagscontent jeder Art per RAG in Dialogsysteme integrieren. In der Praxis dagegen ist vorherige sorgfältige Analyse geboten, wobei sich schnell die Spreu vom Weizen trennt.

Klar erkennbare Einsatzfelder sind:

  1. Fachinformationsverlage (Medizin, Recht, Technik)

  2. Bildungsverlage

  3. Ratgeber- und Touristikverlage (bei klar definiertem Mehrwert)

Weniger eindeutig sind:

  1. Belletristik (außer bei starken Autoren-/Reihenmarken)

  2. Magazine und Zeitungen (abhängig vom Archivwert)

Entscheidend ist die Frage: Erwartet meine Zielgruppe diese Form des Informationszugangs? Und ist sie bereit, dafür zu zahlen?

Praktische Empfehlungen zum Vorgehen, Schritt für Schritt

Ein voll entwickeltes Dialogsystem aufzubauen, ist interdisziplinäre Arbeit. In Phasen mit knappen Kapazitäten und allseitiger starker Belastung durch das Tagesgeschäft sind solche Projekte schwierig zu organisieren und laufen Gefahr, zu lange zu brauchen.

Erfreulicherweise können selbst abgegrenzte, überschaubare Teilprojekte bereits Nutzen bringen. Aus diesen können sich mittel- und langfristig große Architekturen bauen lassen, wie die folgende Aufstellung zeigt:

Sofort umsetzbar:

  1. Interne RAG-Systeme zur Wissensdemokratisierung aufbauen

  2. Mit Prototypen starten (Aufwand: unter einem Tag)

  3. Hypothesen mit echten Kund:innen validieren

  4. In strukturierte Datenhaltung investieren

Mittelfristig:

  1. Content-Strategie für KI-Nutzung entwickeln

  2. BPMN-Prozesse für Automatisierung definieren

  3. Qualitätssicherungsprozesse anpassen

  4. Neue Kompetenzen aufbauen (weniger technisch als gedacht)

Langfristig:

  1. Von monolithischen Standalone-Lösungen zu offenen Wissensplattformen

  2. Geschäftsmodelle von Content-Verkauf zu Service-Anbieter weiterentwickeln

  3. Customized B2B-Lösungen (Integration von Verlags- und Kundendaten)

Zeitersparnis konkret

Die von den Konferenzteilnehmern präsentierten Teilprojekte und Use Cases zeigen erhebliche Effizienzgewinne:

  1. Recherche: bis 70 %

  2. Übersetzung: bis 75 %

  3. Teaser-Erstellung: bis 80 %

  4. Bildverschlagwortung: bis 90 %

Die Leistungszahlen sind im Detail abhängig vom konkreten Anwendungsfall – aber die Größenordnung ist valide.

Fazit

Verlage haben exzellente Voraussetzungen für attraktive Geschäftsmodelle auf RAG-Basis, benötigen aber eine Content-Strategie, strukturierte Daten und die Bereitschaft zur organisatorischen Veränderung. Der Einstieg ist niedrigschwelliger als gedacht, der potenzielle Impact erheblich. Wer jetzt zögert, riskiert es möglicherweise, den Anschluss an seinen Wettbewerb zu verlieren.

Die Referent:innen

Anja Paquin ist Senior Managerin bei Publisher Consultants. Sie berät Medienunternehmen in den Bereichen Workflow & Prozesse, Strategie, Organisationsentwicklung und Nachhaltigkeit. Die Publisher Consultants sind bewährte Partner für Verlage. Mit ihrer tiefen Branchenkenntnis entwickeln sie individuelle Lösungen in den Bereichen Strategie und Geschäftsmodelle, Workflow- und Prozessoptimierung, Kostenoptimierung und Beschaffung, Technologie sowie Nachhaltigkeitsstrategie.

Raphael Baier ist Geschäftsführer der Fabasoft Xpublisher GmbH. Der Branchenexperte verfügt über mehr als 20 Jahre Erfahrung an der Schnittstelle von IT und Medien. In leitenden Positionen war er unter anderem für den Deutschen Landwirtschaftsverlag, C.H. Beck und den VNR Verlag für die Deutsche Wirtschaft tätig und beriet Medienhäuser bei der Einführung und Integration digitaler Publishing-Plattformen.

Detlef Büttner ist Mitgründer von Negative Space, das Mittelstandsunternehmen strategisch und operativ dabei begleitet, KI jenseits des Hypes zu echten Ergebnissen zu führen – von der Klärung bis zur Implementierung. Er war viele Jahre als Geschäftsführer in Verlags- und Handelsunternehmen tätig (u. a. Verlagsgruppe Georg von Holtzbrinck, Otto Schmidt Verlag, Lehmanns Media).

Hendrik Morr ist seit über fünf Jahren Senior Berater bei der Argestes Managementberatung. Mit einem Hintergrund in Maschinenbau sowie International Management & Technology verbindet er technisches Verständnis mit strategischem, wirtschaftlichem Blick. Sein Fokus liegt auf der Entwicklung digitaler Produkte und Services für mittelständische Unternehmen von der strukturierten Idee bis zur wirtschaftlich tragfähigen Lösung. Der Anspruch: Strategien müssen in konkrete Anwendungen überführt werden, die messbaren Mehrwert schaffen. Er begleitet Unternehmen von der ersten Hypothese bis zur marktfähigen Umsetzung – klar priorisiert und wirkungsorientiert.

Carsten Schwab ist Inhaber und Geschäftsführer der XPS AG in Zürich. Er zählt zu den maßgeblichen Treibern der digitalen Transformation im Publishing. Viele Jahre arbeitete er in Führungsverantwortung in renommierten Verlagen, unter anderem als Mitglied der Geschäftsleitung beim Diogenes Verlag. 2024 erhielt er den dpr digital publishing award (dpr award) in der Kategorie „Digital Leader(ship)“.

Dieser Artikel ist Teil des Channels Digital Publishing Technologien, der sich mit Content-Strategien und Prozessen beschäftigt.  Der Channel wird gesponsert von Fabasoft Xpublisher.