Technologie

Die LUNA-Plattform

LUNA ist unsere hochverfügbare Sprachverarbeitungsplattform. Maßgeschneiderte KI-Modelle, intelligentes Preprocessing und eine flexible Pipeline — echtzeitfähig, unabhängig einsetzbar und frei von Cloud-Abhängigkeiten.

01

Plattform-Architektur

Eine modulare Plattform für geschäftskritische Sprachverarbeitung

LUNA ist eine hochverfügbare Sprachverarbeitungsplattform, konzipiert für den kontinuierlichen, unterbrechungsfreien Betrieb. Die modulare Architektur trennt Audio-Erfassung, Vorverarbeitung, Spracherkennung, Nachverarbeitung und Ergebnisbereitstellung in unabhängige, redundante Stufen. Jede Stufe kann eigenständig skaliert und überwacht werden. Die Plattform empfängt Audio aus verschiedenen Quellen, leitet es durch spezialisierte Modelle und liefert strukturierte Ergebnisse an beliebige Zielsysteme.

  • Hochverfügbare Architektur mit automatischem Failover und Redundanz
  • Modulare Plattform — jede Stufe unabhängig skalier- und überwachbar
  • Unterstützt diverse Audioquellen von Telefonie bis Live-Streaming
  • Konzipiert für den Dauerbetrieb in geschäftskritischen Umgebungen

02

Sprach-Vorverarbeitung

Intelligentes Prefiltering und Modell-Routing

Bevor Audio die Spracherkennung erreicht, optimiert LUNAs Preprocessing-Pipeline das Signal für maximale Erkennungsgenauigkeit. Das Signal wird normalisiert und gefiltert, um Rauschen zu reduzieren und unterschiedliche Eingangsqualitäten auszugleichen. Ein automatisches Spracherkennungsmodul identifiziert die gesprochene Sprache, bevor das Audio weitergeleitet wird. Der Modell-Router wählt dann dynamisch das optimale Sprachmodell basierend auf erkannter Sprache, Dialektindikatoren, Audioqualitätsmetriken und Domänenkontext — sodass jeder Audiostrom vom bestgeeigneten Modell verarbeitet wird.

  • Adaptives Audio-Prefiltering mit Rauschunterdrückung und Signalnormalisierung
  • Automatische Spracherkennung vor dem Modell-Routing
  • Intelligenter Modell-Router mit Auswahl nach Qualität, Dialekt und Domäne
  • Dynamische Optimierung für unterschiedliche Audiobedingungen und Eingangsquellen

03

Echtzeit-Spracherkennung

Model Fusion für höchste Erkennungsgenauigkeit

LUNA setzt auf Model Fusion: Jedes Wort wird parallel an mehrere spezialisierte Sprachmodelle übergeben, die je nach Audiosignal — Hintergrundgeräusche, Dialekt, Sprechgeschwindigkeit — unterschiedlich gewichtet werden. Ein übergeordnetes Modell wertet die Einzelergebnisse aus und ermittelt die präziseste Transkription. So kombiniert das System die Stärken verschiedener Modelle und liefert Ergebnisse in Echtzeit, die deutlich über der Genauigkeit jedes einzelnen Modells liegen.

  • Jedes Wort wird parallel durch mehrere Modelle verarbeitet
  • Dynamische Modellgewichtung basierend auf Audiosignal, Dialekt und Sprechbedingungen
  • Kontinuierliche Verarbeitung in Echtzeit mit Multi-Modell-Pipeline
  • Automatische Erkennung und Zuordnung mehrerer Sprecher

04

Intelligente Nachverarbeitung

Von der Rohtranskription zu strukturierten Daten

Nach der Spracherkennung verwandelt LUNAs Nachverarbeitungs-Pipeline Rohtexte in verwertbare Daten. Disfluenzen — Füllwörter wie 'äh' und 'ähm', Fehlstarts, Selbstkorrekturen und Wiederholungen — werden automatisch erkannt und bereinigt, sodass aus natürlicher gesprochener Sprache lesbarer Text entsteht. Jedes erkannte Segment erhält silbenbasierte Konfidenzwerte, die es nachgelagerten Systemen ermöglichen, unsichere Passagen zu markieren oder eine menschliche Überprüfung anzufordern. Aus einem einstündigen Gespräch wird eine strukturierte Zusammenfassung mit Sprecherzuordnung, Themenextraktion und formatiertem Protokoll — automatisch und anpassbar an den jeweiligen Anwendungsfall.

  • Disfluenz-Bereinigung: Füllwörter, Fehlstarts und Selbstkorrekturen
  • Silbenbasierte Konfidenzwerte zur Qualitätsbewertung
  • Automatische Zusammenfassungen mit einstellbarem Detailgrad
  • Extraktion von Kerninhalten, Entitäten und Fragestellungen
  • Strukturierung und Formatierung nach vorgegebenen Vorlagen
  • Anpassbare Verarbeitungsschritte für individuelle Anforderungen

05

Plattform-Eingänge und -Ausgänge

Anbindung an Ihre Audioquellen und Ergebnisbereitstellung

LUNA verbindet sich mit den Audioquellen, die Ihre Organisation bereits nutzt — und liefert Ergebnisse dorthin, wo sie gebraucht werden. Die Connector-Architektur der Plattform ist erweiterbar: Neue Eingangsquellen und Ausgabeziele können hinzugefügt werden, ohne die Kernverarbeitung zu verändern.

Audio-Eingänge

  • POTS/PSTN — klassische Telefonie
  • Microsoft Teams-Integration
  • Google Meet-Integration
  • Eigenes latenzarmes, zuverlässiges Live-Streaming-Protokoll für Echtzeit-Audio
  • SIP/VoIP und weitere Audioquellen

Ergebnis-Schnittstellen

  • REST-APIs für den Abruf von Ergebnissen
  • WebSocket-Streams für Echtzeit-Ergebnisbereitstellung
  • Webhooks für ereignisgesteuerte Integration
  • Direkte Integration in Dokumentenmanagement- und Unternehmenssysteme

06

Architektur und Bereitstellung

Dieselbe Plattform — zwei Betriebsmodelle

LUNA lässt sich sowohl vollständig in Ihrer Infrastruktur als auch in unserer deutschen Cloud betreiben. In beiden Fällen kommt dieselbe Plattform-Software zum Einsatz — der Funktionsumfang ist identisch. LUNAs Architektur isoliert Verarbeitungskomponenten für unabhängige Skalierung und gewährleistet automatisches Failover über redundante Knoten.

On-Premises

Die vollständige LUNA-Plattform läuft auf Ihren Servern. Es wird keine Internetverbindung benötigt — auch nicht für Updates oder Lizenzen. Alle Stufen — Vorverarbeitung, Erkennung und Nachverarbeitung — arbeiten innerhalb Ihres Netzwerks. Für Umgebungen mit besonderen Sicherheitsanforderungen ist ein vollständig isolierter Betrieb (Air-Gap) möglich. LUNA übernimmt eigenständig die Überwachung der Komponentengesundheit und automatische Wiederherstellung.

Deutsche Cloud

Wir betreiben LUNA für Sie in europäischen Rechenzentren. Updates, Monitoring und Skalierung übernimmt unser Team. Die Datenverarbeitung findet ausschließlich in Deutschland statt. Die Cloud-Bereitstellung umfasst automatische Skalierung zur Bewältigung von Lastspitzen bei Veranstaltungen und Sitzungen.

07

Spezialisierte Sprachmodelle

Unabhängig von externen Anbietern

Alle Sprachmodelle von LUNA sind vollständig lokal betreibbar. Wir setzen keine externen APIs für Spracherkennung ein — kein Google Speech, kein OpenAI Whisper, keine AWS Transcribe. Dadurch fließen keine Daten an externe Dienste. LUNAs Modell-Router kann aus einem Portfolio spezialisierter Modelle wählen, die jeweils für bestimmte Sprachen, Dialekte, akustische Bedingungen oder Fachvokabulare optimiert sind.

  • Vollständig unabhängig — kein Einsatz externer Dienste
  • Keine Datenübertragung an Drittanbieter-APIs
  • Gezielte Optimierung für spezifische Anwendungsfälle und Domänen
  • Kontinuierliche Weiterentwicklung auf Basis realer Einsatzerfahrungen

LUNA in Aktion erleben

Fordern Sie eine Live-Demo an und sehen Sie, wie LUNA Sprache in Echtzeit verarbeitet und sich in Ihre Infrastruktur integriert.

Demo anfordern