Technologie

Die LUNA-Plattform

LUNA ist unsere hochverfügbare Sprachverarbeitungsplattform. Maßgeschneiderte KI-Modelle, intelligentes Preprocessing und eine flexible Pipeline — echtzeitfähig, unabhängig einsetzbar und frei von Cloud-Abhängigkeiten.

Plattform-Architektur

Eine modulare Plattform für geschäftskritische Sprachverarbeitung

LUNA ist eine hochverfügbare Sprachverarbeitungsplattform, konzipiert für den kontinuierlichen, unterbrechungsfreien Betrieb. Die modulare Architektur trennt Audio-Erfassung, Vorverarbeitung, Spracherkennung, Nachverarbeitung und Ergebnisbereitstellung in unabhängige, redundante Stufen. Jede Stufe kann eigenständig skaliert und überwacht werden. Die Plattform empfängt Audio aus verschiedenen Quellen, leitet es durch spezialisierte Modelle und liefert strukturierte Ergebnisse an beliebige Zielsysteme.

Hochverfügbare Architektur mit automatischem Failover und Redundanz
Modulare Plattform — jede Stufe unabhängig skalier- und überwachbar
Unterstützt diverse Audioquellen von Telefonie bis Live-Streaming
Konzipiert für den Dauerbetrieb in geschäftskritischen Umgebungen

Sprach-Vorverarbeitung

Intelligentes Prefiltering und Modell-Routing

Bevor Audio die Spracherkennung erreicht, optimiert LUNAs Preprocessing-Pipeline das Signal für maximale Erkennungsgenauigkeit. Das Signal wird normalisiert und gefiltert, um Rauschen zu reduzieren und unterschiedliche Eingangsqualitäten auszugleichen. Ein automatisches Spracherkennungsmodul identifiziert die gesprochene Sprache, bevor das Audio weitergeleitet wird. Der Modell-Router wählt dann dynamisch das optimale Sprachmodell basierend auf erkannter Sprache, Dialektindikatoren, Audioqualitätsmetriken und Domänenkontext — sodass jeder Audiostrom vom bestgeeigneten Modell verarbeitet wird.

Adaptives Audio-Prefiltering mit Rauschunterdrückung und Signalnormalisierung
Automatische Spracherkennung vor dem Modell-Routing
Intelligenter Modell-Router mit Auswahl nach Qualität, Dialekt und Domäne
Dynamische Optimierung für unterschiedliche Audiobedingungen und Eingangsquellen

Echtzeit-Spracherkennung

Model Fusion für höchste Erkennungsgenauigkeit

LUNA setzt auf Model Fusion: Jedes Wort wird parallel an mehrere spezialisierte Sprachmodelle übergeben, die je nach Audiosignal — Hintergrundgeräusche, Dialekt, Sprechgeschwindigkeit — unterschiedlich gewichtet werden. Ein übergeordnetes Modell wertet die Einzelergebnisse aus und ermittelt die präziseste Transkription. So kombiniert das System die Stärken verschiedener Modelle und liefert Ergebnisse in Echtzeit, die deutlich über der Genauigkeit jedes einzelnen Modells liegen.

Jedes Wort wird parallel durch mehrere Modelle verarbeitet
Dynamische Modellgewichtung basierend auf Audiosignal, Dialekt und Sprechbedingungen
Kontinuierliche Verarbeitung in Echtzeit mit Multi-Modell-Pipeline
Automatische Erkennung und Zuordnung mehrerer Sprecher

Intelligente Nachverarbeitung

Von der Rohtranskription zu strukturierten Daten

Nach der Spracherkennung verwandelt LUNAs Nachverarbeitungs-Pipeline Rohtexte in verwertbare Daten. Disfluenzen — Füllwörter wie 'äh' und 'ähm', Fehlstarts, Selbstkorrekturen und Wiederholungen — werden automatisch erkannt und bereinigt, sodass aus natürlicher gesprochener Sprache lesbarer Text entsteht. Jedes erkannte Segment erhält silbenbasierte Konfidenzwerte, die es nachgelagerten Systemen ermöglichen, unsichere Passagen zu markieren oder eine menschliche Überprüfung anzufordern. Aus einem einstündigen Gespräch wird eine strukturierte Zusammenfassung mit Sprecherzuordnung, Themenextraktion und formatiertem Protokoll — automatisch und anpassbar an den jeweiligen Anwendungsfall.

Disfluenz-Bereinigung: Füllwörter, Fehlstarts und Selbstkorrekturen
Silbenbasierte Konfidenzwerte zur Qualitätsbewertung
Automatische Zusammenfassungen mit einstellbarem Detailgrad
Extraktion von Kerninhalten, Entitäten und Fragestellungen
Strukturierung und Formatierung nach vorgegebenen Vorlagen
Anpassbare Verarbeitungsschritte für individuelle Anforderungen

Plattform-Eingänge und -Ausgänge

Anbindung an Ihre Audioquellen und Ergebnisbereitstellung

LUNA verbindet sich mit den Audioquellen, die Ihre Organisation bereits nutzt — und liefert Ergebnisse dorthin, wo sie gebraucht werden. Die Connector-Architektur der Plattform ist erweiterbar: Neue Eingangsquellen und Ausgabeziele können hinzugefügt werden, ohne die Kernverarbeitung zu verändern.

Audio-Eingänge

POTS/PSTN — klassische Telefonie
Microsoft Teams-Integration
Google Meet-Integration
Eigenes latenzarmes, zuverlässiges Live-Streaming-Protokoll für Echtzeit-Audio
SIP/VoIP und weitere Audioquellen

Ergebnis-Schnittstellen

REST-APIs für den Abruf von Ergebnissen
WebSocket-Streams für Echtzeit-Ergebnisbereitstellung
Webhooks für ereignisgesteuerte Integration
Direkte Integration in Dokumentenmanagement- und Unternehmenssysteme

Architektur und Bereitstellung

Dieselbe Plattform — zwei Betriebsmodelle

LUNA lässt sich sowohl vollständig in Ihrer Infrastruktur als auch in unserer deutschen Cloud betreiben. In beiden Fällen kommt dieselbe Plattform-Software zum Einsatz — der Funktionsumfang ist identisch. LUNAs Architektur isoliert Verarbeitungskomponenten für unabhängige Skalierung und gewährleistet automatisches Failover über redundante Knoten.

On-Premises

Die vollständige LUNA-Plattform läuft auf Ihren Servern. Es wird keine Internetverbindung benötigt — auch nicht für Updates oder Lizenzen. Alle Stufen — Vorverarbeitung, Erkennung und Nachverarbeitung — arbeiten innerhalb Ihres Netzwerks. Für Umgebungen mit besonderen Sicherheitsanforderungen ist ein vollständig isolierter Betrieb (Air-Gap) möglich. LUNA übernimmt eigenständig die Überwachung der Komponentengesundheit und automatische Wiederherstellung.

Deutsche Cloud

Wir betreiben LUNA für Sie in europäischen Rechenzentren. Updates, Monitoring und Skalierung übernimmt unser Team. Die Datenverarbeitung findet ausschließlich in Deutschland statt. Die Cloud-Bereitstellung umfasst automatische Skalierung zur Bewältigung von Lastspitzen bei Veranstaltungen und Sitzungen.

Spezialisierte Sprachmodelle

Unabhängig von externen Anbietern

Alle Sprachmodelle von LUNA sind vollständig lokal betreibbar. Wir setzen keine externen APIs für Spracherkennung ein — kein Google Speech, kein OpenAI Whisper, keine AWS Transcribe. Dadurch fließen keine Daten an externe Dienste. LUNAs Modell-Router kann aus einem Portfolio spezialisierter Modelle wählen, die jeweils für bestimmte Sprachen, Dialekte, akustische Bedingungen oder Fachvokabulare optimiert sind.

Vollständig unabhängig — kein Einsatz externer Dienste
Keine Datenübertragung an Drittanbieter-APIs
Gezielte Optimierung für spezifische Anwendungsfälle und Domänen
Kontinuierliche Weiterentwicklung auf Basis realer Einsatzerfahrungen

LUNA in Aktion erleben

Fordern Sie eine Live-Demo an und sehen Sie, wie LUNA Sprache in Echtzeit verarbeitet und sich in Ihre Infrastruktur integriert.

Demo anfordern