Discover Digital by BWV in Braille-Schrift kodiert: Mit ähnlich einfachen Verfahren der Textkodierung erzielen künstliche neuronale Netze sehr gute Erfolge.
Ich habe mal gelernt, ein Computer versteht nur Nullen und Einsen. Wie passt das Eine mit dem Anderen zusammen?
Techniken für das Konvertieren von Texten in Sequenzen von Zahlen sind nicht neu, schon das Morse-Alphabet wurde für die Kodierung von Buchstaben und Zeichen durch Punkte und Striche entwickelt. Auch die Blindenschrift Braille ist eine binäre Kodierung von Texten durch Punkte, die in einer Fläche angeordnet werden.
Tatsächlich lassen sich mit ähnlich einfachen Verfahren zur Aufbereitung von Texten für die Verarbeitung mit künstlichen neuronalen Netzen sehr gute Erfolge erzielen. Fortgeschrittene Verfahren für die Kodierung von Texten kommen zum Einsatz, wenn Texte künstlich generiert werden sollen, beispielsweise beim maschinellen Übersetzen.
Bevor Sie ein Expertensystem in die Praxis entlassen, werden Sie bestimmt die Zuverlässigkeit testen. Was ist Ihr Maßstab dabei? Wann ist das Deep Learning abgeschlossen?
Der Prozentwert der Texte aus einer Testmenge, denen bei einem Testlauf die korrekte Ziffer zugeordnet wird, ist der vermutlich am meisten genutzte Maßstab für die Qualität solcher Zuordnungen. Bei den kurzen Texten aus Rechnungen von Zahnlaboren, Zahnärzten oder Ärzten lassen sich meiner Erfahrung nach mit überschaubarem technischen Aufwand Werte von 95 Prozent erzielen, manchmal sogar darüber. Selbst Experten aus der Leistungssachbearbeitung der Barmenia Krankenversicherung bezeichnen Ergebnisse in dieser Höhe als erstaunlich gut.
„KI liegt nicht immer richtig. Menschen aber auch nicht.“
Künstliche Intelligenz, KI, kann sehr erfolgreich sein, wenn sie für eingeschränkte, spezialisierte Aufgabenstellungen genutzt wird. Mit Techniken der digitalen Bildverarbeitung können beispielsweise Verkehrsschilder unterschieden oder Hunde verschiedenen Rassen zugeordnet werden. Um solche Aufgaben geht es bei der „ImageNet Large Scale Visual Recognition Challenge“, einer Art inoffizieller Weltmeisterschaft der digitalen Bildverarbeitung. Dabei sollen u.a. Objekte auf Bildern erkannt werden, wobei 1.000 verschiedene Klassen von Objekten unterschieden werden.
2015 wurde dabei ein Niveau erreicht, das als „human parity“ bezeichnet wird: Spezialisierte künstliche neuronale Netze können uns Menschen seitdem bei dieser Aufgabe übertreffen. Die Spitzenergebnisse stiegen im Lauf des Jahres 2015 auf 96,5 Prozent, eine menschliche Vergleichsgruppe kam auf 94,9 Prozent.
Eine einfache Frage macht deutlich, was KI im praktischen Einsatz mindestens leisten muss: Wer würde beim Autofahren ein Navigationssystem verwenden, das regelmäßig in die Irre führt? Das Training eines KI-Sytems für den Einsatz in einem Versicherungsunternehmen kann ab dem Punkt abgeschlossen werden, an dem das KI-System so gut wird, dass es von Auftraggebern und Anwendern akzeptiert und genutzt wird. Das wäre bei Ergebnissen von „human parity“ oder darüber der Fall.
Die enormen Fortschritte im Bereich künstliche Intelligenz basieren unter anderem auf Open-Source-Tools, die auch Sie verwenden. Spielen Sie Ihre Ergebnisse, die Sie erzielen, an die Entwickler-Community zurück oder sind das dann Betriebsgeheimnisse?
Im aktuellen Sonderheft „Machine Learning“ der Fachzeitschrift iX ist ein Beitrag von mir erschienen, der ein aktuelles Deep-Learning Verfahren für das Klassifizieren kurzer Texte beschreibt. Ein Demo-Projekt für erste Schritte zur praktischen Umsetzung vergleichbarer Projekte kann per Download bezogen werden.
Das Grundprinzip der linguistischen Datenverarbeitung, mit dem Sie arbeiten hat sich scheinbar bewährt. Die Übertragung auf andere Aufgabenstellungen ist demnach nur noch Fleißarbeit?
Aktuell lassen sich erfahrungsgemäß gute Erfolge bei der Klassifikation kurzer Texte erzielen, die aus wenigen Wörtern oder Zeilen bestehen: Worum handelt es sich, was ist die Intention des Kunden, ist seine Aussage positiv oder negativ? Bei längeren Texten wird das in den meisten Fällen deutlich schwieriger werden. Die Fehlerquoten nehmen mit der Länge der Texte zu.
Es gibt eine weitere Hürde: Für maschinelles Lernen sind umfangreiche Trainingsmengen erforderlich. Versicherungen haben Texte und Daten aus manuellen Tätigkeiten und Entscheidungsprozessen in der Vergangenheit aber nicht immer in maschinell verwertbarer Form gesammelt.
Selbst wenn wir das von heute auf morgen verändern könnten: In vielen Geschäftsprozessen werden die Stückzahlen gar nicht ausreichen, um die erforderlichen Mengen an Trainingsdaten in überschaubarer Zeit zu sammeln.
Die Entwicklung wird sicherlich weitergehen. Die Frage ist, wohin? Wo steht die Versicherungsbranche Ihrer Meinung nach, sagen wir, in fünf Jahren?
In fünf Jahren werden die technischen Systeme im Input-Management der Versicherungsunternehmen durch den Einsatz von Deep Learning leistungsfähiger sein. Die Datengewinnung aus Scan-Bildern oder Fotos, die mit Apps übermittelt werden, wird deutlich weniger manuelle Aufwände erfordern als heute. Bei einem stetig wachsenden Teil der Dokumente wird es ohne manuelle Nachbearbeitung funktionieren.
Die darauf folgenden Geschäftsprozesse zur Antragsbearbeitung werden in den größeren Unternehmen teilweise automatisiert sein. Deutlich mehr Anträge als heute werden innerhalb von wenigen Minuten automatisch verarbeitet. Technische Systeme werden dafür einen Teil der notwendigen Informationen aus „unstrukturierten“ Daten wie Texten gewinnen.
So wie es für Rad- oder Autofahrer heute selbstverständlich ist, ein Navigationssystem zu nutzen, werden Mitarbeiter von Versicherungen bei wiederkehrenden Aufgaben zunehmend mit entscheidungsunterstützenden Systemen arbeiten, z. B. bei der Risikobewertung oder der Schadenbearbeitung. Sie werden damit bessere Entscheidungen treffen und mit ihrer Arbeit stärker zum Erfolg beitragen. Einige Kunden werden für einfache Anliegen Chat- oder Sprachbots nutzen.
„Prozessverbesserungen hat es immer schon gegeben.“
Die Aufgaben und Anforderungen in der klassischen Sachbearbeitung verändern sich vielfach durch die zunehmende Automatisierung. Ganz allgemein gefragt: Was empfehlen Sie den jetzigen MitarbeiterInnen, um mit der Entwicklung Schritt zu halten? Und was sollten zukünftige Generationen zum Berufsstart mitbringen?
Das ist sicher eher eine Frage in Richtung der Personalabteilung. Einfache Prozesse werden automatisiert und es werden zunehmend Kapazitäten für komplexere Aufgaben frei, beispielsweise für vertiefte Rechnungsprüfungen in der Schaden- oder Leistungssachbearbeitung. Das ist aber nicht neu. Prozessverbesserungen hat es immer schon gegeben. Da heißt meine Empfehlung Qualifizierung, Weiterbildung und Flexibilität.
Unabhängig davon wird es weiter Aufgabenbereiche geben, bei denen ein Teil unserer Kunden den Kontakt mit kompetenten Kaufleuten für Versicherungen und Finanzen bevorzugen.
Zur Person: Gerhard Hausmann ist Architekt für wissensbasierte Systeme bei der Barmenia Krankenversicherung. Er beschäftigt sich mit der Prozessautomation, insbesondere der Entwicklung von Expertensystemen für die Prüfung von Rechnungen.