NET 4/2023
17 www.net-im-web.de 4/23 Das Projekt NotAs Übertrag des gesprochenen Wortes in ein Textformat ermöglicht ferner die inhaltliche Analyse mittels der vorgeschlagenen Inter- pretationsfunktion. Der NotAs-Demonstrator Die o.g. Funktionen wurden als jeweils sepa- rateDienste in ein übergeordnetes Framework integriert, dass eine Benutzeroberfläche sowie Schnittstellen zu einerTelekommunikations- infrastruktur bereitstellt. Konkret handelt es sich um Containeranwendungen innerhalb eines Kubernetes-Clusters. Das Frontend ist webbasiert, was den Projektbeteiligten einen Remote-Zugriff auf den zentral integrierten Systemdemonstrator ermöglichte. Die An- bindung an das Telekommunikationsnetz erfolgt via Voice-over-IP. Der eingehende und der ausgehende Audiostream werden jeweils einer separaten Instanz der ASR zu- geführt. Die Ausgabe der Sprachsynthese wird in den Audiostream von der Seite der Leitstelle eingeschleift. Bei den Diensten für die maschi- nelle Übersetzung und die Semantische Interpretation handelt es sich um projekt- spezifische Lösungen, die auf Grundlage aktueller Modelle entwickelt wurden. Für die Sprachsynthese und die automatische Spracherkennung wurde kommerziell ver- fügbare Software verwendet, da der not- wendige Aufwand für eine Eigenentwicklung im Rahmen der zweijährigen Projektlaufzeit nicht hätte erbracht werden können. Hier wurden verschiedene verfügbare Lösungen evaluiert. Ferner bedurfte es umfangreicher Arbeiten zur Adaption der Automatischen Spracherkennung an den untersuchten An- wendungsfall Notrufannahme. Die für das Anlernen und die Evaluation der Dienste notwendigen Trainingsdaten wurden aus Gründen des Datenschutzes synthetisch erzeugt. Mit Blick auf eine mögliche zu- künftige Produktivanwendung wurde der Systemdemonstrator als On-Premise-Lösung konzipiert, die – theoretisch – innerhalb einer geschlossenen IT-Infrastruktur betrieben werden kann. Umeine praxisnahe Umsetzung der Projektinhalte zu gewährleisten, wurden Feuerwehrangehörige in die Arbeiten ein- gebunden. In der Hauptsache betrifft dies die Ausarbeitung eines nutzerzentrierten Anforderungskatalogs, die Auslegung des Bedienkonzepts – insbesondere die Gestal- tung des Frontends – sowie die Erzeugung der Trainingsdaten sowie der begleitenden Evaluation. Auf dem Weg in die Praxis Das Projekt wurde planmäßig am31.Septem- ber 2022 abgeschlossen. Die vorgeschlagene Verarbeitungskette wurde von den Projektbe- teiligten in Form eines Systemdemonstrators umgesetzt. Das Projekt ermöglichte es den Beteiligten, den aktuellen Stand der Technik in Bezug auf die automatische Sprachver- arbeitung zu evaluieren und die einzelnen Technologien auf die Notrufdomäne an- zuwenden. Es konnte gezeigt werden, dass eine Adaption der einzelnen Dienste an die Notrufdomäne möglich ist. Allerdings wurde deutlich, dass weiterhin Optimierungsbedarf besteht, bevor die im Projekt untersuchten Assistenzfunktionen in eine mögliche Pro- duktivanwendung überführt werden können. Anhand der Ergebnisse konnten Zielvor- gaben für die weitere Forschungs- und Ent- wicklungsarbeiten abgeleitet werden. Dies betrifft die Akquise und Vorbereitung von Trainingsdaten, die weitere Adaptierung der einzelnen Dienste bzw. Technologien auf die Notrufdomäne sowie insgesamt die weitere Verbesserung in Bezug auf die Genauigkeit und Verfügbarkeit. Eine Schlüsselstellung nimmt nach Auffassung des Konsortiums die automatische Spracherkennung ein. Hier besteht aus Sicht der Projektbeteiligten wei- terhin ein Forschungs- und Entwicklungs- bedarf. Die Softwarehersteller sind dabei gefragt. Zusätzliches Potenzial besteht nach Auffassung der Projektbeteiligten etwa in einer Optimierung der Audioqualität, bevor ein Audiostream der ASR zugeführt wird. Einen bereits relativ hohen Entwicklungs- stand haben aus Sicht des Konsortiums die Technologien zur maschinellen Übersetzung und Sprachsynthese erreicht. Angesichts der rapidenEntwicklun- gen in Bezug auf künstliche Intelligenz im Allgemeinen sowie die automatische Sprach- verarbeitung im Speziellen, erscheint es aus Sicht des Konsortiums absehbar, dass einzelne technische Lösungen einen ausreichend hohen Reifegrad aufweisen werden, um auch in an- spruchsvollen Anwendungsbereichen – wie der Notrufannahme – eingesetzt zu werden. Das Projekt hat hier diverse Ansatzpunkte aufgezeigt, wie KI-basierte Anwendungen sukzessive in das Umfeld Leitstelle integriert werden können. eurofunk Kappacher arbeitet daran, die im Projekt untersuchten Techno- logien in den Produktivbetrieb zu überführen. Hier geht derTrend zu modularen, vollintegrierten Benutzerumgebungen, die bedarfsgerechte Informationen aus unter- schiedlichen Datenquellen bereitstellen und langfristig ähnliche KI-basierte Dienste, wie die im Projekt NotAs untersuchten Über- setzungs- und Interpretationsfunktionen beinhalten werden. Doch auch weniger kom- plexe Funktionen können dazu beitragen, die (kognitive) Arbeitslast bei der Notrufannahme mittelfristig zu vermindern. Ein Beispiel sind KI-basierte Methoden zur Optimierung der Sprachqualität, beispielsweise durch das Ausblenden von Hintergrundgeräuschen. Da hier keine Inhalte verarbeitet werden, besteht ein weitaus geringerer Bedarf an do- mänenspezifischenTrainingsdaten, dennoch können derartige Funktionen dieMitarbeiter in den Leitstellen bei ihrer Tätigkeit unter- stützen, indem eine deutliche, weniger miss- verständliche Kommunikation ermöglicht wird. Die Schlüsseltechnologie künstliche Intelligenz bietet viele Möglichkeiten, die Reaktionsfähigkeit der notrufbearbeitenden Stellen zu stärken, die Mitarbeiter bei der Ausübung ihrer anspruchsvollen Tätigkeit zu unterstützen und letztendlich Personen in Notsituationen schneller eine geeignete Hilfeleistung zukommen zu lassen.
Made with FlippingBook
RkJQdWJsaXNoZXIy MjE2Mzk=