11.02.2019

Wer spricht denn da? Automatische Erkennung verschiedener Sprecher unterstützt den Kundenkontakt

Die EML European Media Laboratory GmbH zeigt auf der internationalen Messe CCW 2019 in Berlin, wie Sprachtechnologie im Call-Center für mehr Effizienz und Qualitätskontrolle sorgen kann: durch die automatische Verschriftung, die Erkennung verschiedener Sprecher und eine Stichwortsuche in Echtzeit. Das Heidelberger Unternehmen setzt dafür unter anderem Verfahren der Künstlichen Intelligenz ein.

Berlin/Heidelberg. Das Heidelberger IT-Unternehmen EML European Media Laboratory GmbH ist auch in diesem Jahr wieder auf der CCW, der Fachmesse für Telekommunikation, mit einem eigenen Stand (Halle 2, Stand C19) vertreten. Die Messe findet vom 19. bis 21. Februar in Berlin statt, es werden mehr als 8000 Besucher erwartet. Auf der CCW zeigen die Heidelberger Sprachtechnologen Anwendungen für den Bereich des telefonischen Kundenkontakts, die eingehende Anrufe in Echtzeit in Text umwandeln. Das Erkennungsergebnis kann dann einfach und schnell weiterverarbeitet werden. Mit einer automatischen Sprechererkennung ist es zudem möglich, den erzeugten Text automatisch den am Gespräch beteiligten Sprechern zuzuordnen. Die vorgestellten Systeme sind datenschutztauglich, weil sie „on-premise", also ohne permanente Datenverbindung nach außen, arbeiten.

Neueste Technologien zur Sprachanalyse


Bietet Vorteile im Call-Center: Automatische Sprechererkennung im Kundendialog. Foto: EML

Der „EML Transcription Server" wandelt die eingehenden Anrufe sofort vollautomatisch und sprecherunabhängig in maschinell durchsuchbaren Text um. Danach klassifiziert der „EML Speech Mining Server" die Ergebnisse nach vordefinierten Themen-Kategorien, der Häufigkeit von bestimmten Ausdrücken sowie nach Schlüsselwörtern. Er identifiziert häufige, neu auftretende Begriffe und verknüpft die Ergebnisse miteinander. Die Spracherkennung in Echtzeit erlaubt auch die einfache Überprüfung und effiziente Einhaltung der Gesprächsrichtlinien im Call-Center. „Das, was zurzeit als Künstliche Intelligenz durch die Medien geht, ist schon eine Weile unser täglich Brot", erläutert EML- Geschäftsführer Prof. Andreas Reuter. „Mit neuronalen Netzen und Deep Learning erreichen wir höchste Erkennungsraten." Das System arbeitet in mehreren Sprachen: Neben Deutsch und Englisch bietet das EML die Sprachanalyse unter anderem auch auf Arabisch und Chinesisch an.

Effizienz und Qualitätssicherung: automatische Sprechererkennung

Die EML-Sprachtechnologie erkennt unterschiedliche Sprecher automatisch und ordnet sie im verschrifteten Text den jeweils beteiligten Gesprächspartnern zu. Das gilt nicht nur für Telefonate im Call-Center, sondern auch bei Meetings aller Art: Es muss am Ende nachvollziehbar sein, wer was gesagt hat. Das ist besonders bei Beratungsgesprächen wichtig: So sind Banken und Versicherungen gesetzlich verpflichtet, diese Gespräche zu protokollieren. Die automatische Sprechererkennung des EML macht es möglich. Durch sogenanntes „Beamforming" lässt sich die Position des Sprechers ermitteln und so das Gesagte einer Person zuordnen. Dies geschieht durch mehrere Mikrofone, die zu einem Array zusammengefasst sind. Die entstandene Transkription macht den genauen Gesprächsverlauf von Besprechungen sprecherspezifisch nachvollziehbar.
Das Besondere daran: Diese Lösung kommt ohne permanente Datenverbindung nach „draußen" aus, denn die Spracherkennung ist im Gerät selbst installiert. Die Sprachdaten bleiben „on-premise", also im eigenen Hause. Die hohen Maßstäbe im Datenschutz legen wir natürlich auch an die Domänenanpassung im Call Center an", erläutert EML-Entwicklungsleiter Markus Klehr. „Erkennung und Modellanpassung sind on-premise, und so können die strengen europäischen Datenschutzrichtlinien eingehalten werden."

Stichwörter automatisch suchen

Die automatische Verschriftung der Anrufe ermöglicht eine effiziente, erweiterte Suche nach bestimmten Schlüsselwörtern. Herkömmliche Systeme müssen bei jedem neuen Suchbegriff alle Anrufe aufs Neue verarbeiten und durchsuchen. Das „Advanced Keyword Spotting" hingegen findet die Schlüsselwörter in den bereits verschrifteten Texten genauso schnell wie eine Suchmaschine. „Wir unterstützen auch das traditionelle Keyword Spotting (KWS)", sagt Markus Klehr. „Das Advanced Keyword Spotting bietet aus unserer Sicht aber viel mehr: Damit lassen sich Schlüsselwörter miteinander in Bezug setzen."

„Your Customer´s Voice": Maßgeschneidertes Marketing-Tool

Der Call-Center-Betreiber kann die Spracherkennung selbst an seine eigene Anwendungsdomäne anpassen. Zum Beispiel lassen sich bei Einführung eines neuen Produkts sofort die Produktbeschreibung und neue Wörter in das Sprachmodell einfügen. Aktuelle Probleme, aber auch aufkommende Trends werden schnell erkannt.
Durch die Sprachanalyse lässt sich effektiv ermitteln, wie viele Anrufer zum Beispiel bestimmte Produktnamen genannt haben – interessante Informationen für Strategie- und Marketingabteilungen eines Unternehmens. Denn die Anrufe sind authentische Kundenaussagen, anhand derer Produkte, Dienstleistungen und Aktivitäten schneller und direkter angepasst werden können. „Die Call-Center-Mitarbeiter haben so die Möglichkeit, Kommunikation kundenfreundlicher und effizienter zu gestalten", so Markus Klehr.

19.02-22.02.2019: EML auf der CCW, Berlin, Estrel Convention Center: Halle 2, Stand C19.

EML European Media Laboratory GmbH
EML European Media Laboratory GmbH wurde von SAP-Mitbegründer Klaus Tschira (1940-2015) als privates IT-Unternehmen gegründet. Das EML entwickelt Software und Technologien in der automatischen Sprachverarbeitung. Schwerpunkt ist die automatische Umwandlung von Sprache in Text (Transkription), die in Telefonie (Speech Analytics, Voice Mail) und mobilen Anwendungen (Voice Texting, Voice Search) eingesetzt wird. www.eml.org