Interview mit Prof. Dr. Udo Kruschwitz

Prof. Dr. Udo Kruschwitz ist seit Juli 2019 Inhaber des Lehrstuhls für Informationswissenschaft an der Universität Regensburg. Zuvor war er als Professor an der School of Computer Science and Electronic Engineering der University of Essex tätig.

Sein Forschungsinteresse liegt an der Schnittstelle zwischen Information Retrieval (IR) und Natural Language Processing (NLP). Er leitete Forschungsprojekte, in denen Algorithmen entwickelt wurden, um unstrukturierte und teilsstrukturierte Textdaten in strukturiertes Wissen und Benutzer-/Kohortenmodelle zu überführen, die in einer Vielzahl von Einsatzfeldern, einschließlich der Suche, Navigation und Zusammenfassung, angewandt wurden.

Prof. Dr. Udo Kruschwitz
Inhaber des Lehrstuhls für Informationswissenschaft
Ich habe zum Juli 2019 den Lehrstuhl für Informationswissenschaft übernommen. Wir sind Teil des Instituts für Information und Medien, Sprache und Kultur (I:IMSK).
Ich habe das Glück, in den Fächern zu unterrichten, die zu meinen Forschungsinteressen passen, das sind insbesondere Themen der maschinellen Sprachverarbeitung (Natural Language Processing) und Suchmaschinentechnologie (Information Retrieval).
Die automatische Sprachverarbeitung und Suchmaschinentechnologie sind Paradebeispiele der KI. Wenn man sich mit dem Thema beschäftigt, beschäftigt man sich mit KI. In den Vorlesungen und Übungen wird daher beispielsweise das maschinelle Lernen schon ganz am Anfang thematisiert. Das Gute ist, dass unsere Studentinnen und Studenten diese Ansätze nicht nur aus der Vorlesung kennen, sondern auch selber anwenden und die Ergebnisse sogar in der einschlägigen Fachliteratur publizieren.
Der Bezug ist einfach zu vermitteln, da wir tagtäglich in den Medien über neueste Fortschritte lesen, von digitalen Assistenten über sprachgesteuerte Kommunikation in Autos bis hin zu von Computern verfassten Büchern (und das ist nur ein kleiner Ausschnitt aus dem Gesamtprogramm). Beim nötigen Vorwissen hat sich auch einiges geändert. Die Eintrittsschwelle in die schöne neue Welt des Deep Learning ist inzwischen so niedrig, dass auch fachfremde Interessierte sich die Bausteine zusammenbasteln können, um die eigenen Probleme durch maschinelle Sprachverarbeitung effektiv zu lösen. Im vergangenen Semester beispielsweise hatte ich eine Studentin der Kriminologie im Kurs, die ohne Informatikvorwissen mit modernsten KI-Modellen eine Anwendung entwickelt hat, um Texte zu klassifizieren.
Informationswissenschaft ist ein sonderbares Fach. Es lässt sich schwer zuordnen, einerseits ist der Bezug zur Informatik ganz deutlich, andererseits ist es auch stark geisteswissenschaftlich geprägt (wir sind ja in der Fakultät für Sprach-, Literatur und Kulturwissenschaften angesiedelt). Daher hat jede Universität mit diesem Fach ihre ganz eigene Ausprägung. Bei uns erwerben die Studentinnen und Studenten eine fundierte Ausbildung auf dem Gebiet der maschinellen Sprachverarbeitung, womit ihnen dann auch viele Türen offenstehen, wo früher eher technische Studienabschlüsse gefragt waren, Stichwort Data Science. Wer aber eher geisteswissenschaftlich geprägt sein möchte, kann auch das tun. Egal, in welche Richtung man sich spezialisiert, unsere Absolventinnen und Absolventen können praktische Probleme selbständig analysieren, sinnvolle Lösungen dazu konzipieren und diese am Ende systematisch evaluieren.
KI ist heute überall. Die einen wollen wissen, wie man KI-Anwendungen baut, die anderen wollen verstehen, was dahintersteckt, wieder andere denken, dass man mit den grundlegenden Kenntnissen zum Thema einen guten Job finden kann. Das sind alles gute Gründe, die Themen im Studium zu vermitteln.

Sinnvoll ist es aber auch, weil es auf dem Gebiet der Künstlichen Intelligenz in den vergangenen Jahren einen Paradigmenwechsel gegeben (man kann auch sagen, eine Revolution). Neuronale Ansätze beim maschinellen Lernen haben die traditionellen statistischen sowie regelbasierte Verfahren auf vielen Gebieten verdrängt. Dazu gibt es im Wesentlichen drei Gründe: immer stärkere Rechenleistung (u.a. durch GPUs), ein enormer Zuwachs an Daten zum Trainieren maschineller Lernalgorithmen und schließlich die Verfügbarkeit skalierbarer und für jeden zugänglichen Tools. Gerade auf dem Gebiet der maschinellen Sprachverarbeitung ist dieser Trend deutlich zu erkennen. Der Standardansatz zur Lösung einer Vielzahl von Problemen geht über eine Architektur namens BERT. Das dazugehörige Paper wurde 2019 auf einer Topkonferenz veröffentlicht und ist (Stand heute) laut Google Scholar sage und schreibe 17.623 zitiert worden. Das heißt, der Stand der Forschung hat sich hier in weniger als drei Jahren radikal verändert, und die Entwicklung geht weiter.
Das Gute an forschungsintensiven Universitäten wie Regensburg ist, dass Forschung und Lehre eng miteinander verknüpft sind. In der Forschung interessiert mich im Moment unter anderem das automatische Erkennen von Hasskommentaren (Hate Speech) oder auch Desinformation (Fake News). Da kann man aber Lehre und Forschung gar nicht so einfach voneinander trennen, denn neben aus Drittmitteln finanzierten Forschungsprojekten bin ich begeistert, was unsere Studentinnen und Studenten in ihren individuellen Projekten dazu entwickeln und in einschlägigen Konferenzen unterbringen können. Da freu ich mich schon aus diesem Grund auf das neue Semester.
Eigentlich fällt fast alles in meiner Forschung unter das Thema KI. Maschinelle Sprachverarbeitung ist ja sehr vielfältig, und die Forschungsprojekte, an denen ich beteiligt war, sind eben genauso facettenreich. Da waren beispielsweise Dialogsysteme wie das deutsche BMBF-Verbundprojekt Verbmobil, das zum Ziel hatte, einen Assistenten zur automatischen Übersetzung gesprochener Sprache zu konstruieren, vor 25 Jahren wohlgemerkt. Ein anderes Dialogsystem war der von British Telecom finanzierte Yellow Pages Assistant. Ein anderer langjähriger Projektpartner ist das in London gegründete Unternehmen Signal AI, dabei geht es vor allem um das automatische Aufspüren interessanter Nachrichten in einem Strom aus Millionen von Agenturmeldungen.
Mein erstes Projekt zur automatischen Syntaxanalyse von einfachen englischen Sätzen mit Hilfe der Programmiersprache LISP war so um 1986. Dabei handelte es sich um ein Schulprojekt mit externem akademischen Partner. Seitdem hat mich die Computerlinguistik nicht mehr losgelassen. Anfang der Neunziger war ich als Teil meines Studiums für ein Jahr an der University of Edinburgh und habe dort viele Kurse zum Thema KI belegt (wie lange das her ist, merkt man daran, dass das KI-Hauptgebäude in der South Bridge vor Jahren schon niedergebrannt ist, der Fachbereich seitdem schon zweimal umgezogen ist und nun auch schon seit über zehn Jahren sein neues Zuhause im Informatics Forum gefunden hat). Heutzutage werde ich dafür bezahlt, mich mit dem Thema zu beschäftigen, was könnte es Besseres geben?
Als Informatiker ist es vielleicht manchmal einfacher, Zugang zu Themen mit KI-Bezug zu finden. Was aber auch gesagt werden muss, ist, dass der rapide Wandel auch bedeutet, dass man ständig am Ball bleiben muss. Das Gebiet verändert sich so schnell, dass der Stand der Forschung vom letzten Jahr zum Teil schon wieder veraltet ist. Bestes Beispiel, um das zu illustrieren, ist die Tatsache, dass das Preprint-Portal arXiv.org insbesondere von Forschern bei Tech-Firmen wie Google, Facebook, Microsoft dazu genutzt wird, die aktuellsten Ergebnisse zu publizieren, weil diese bis zur in drei Monaten stattfindenden Topkonferenz schon wieder überholt sein können.
Es ist erstaunlich, was heute alles möglich ist, das vor Jahren noch als nie erreichbar eingeschätzt wurde, zum Beispiel die sprecherunabhängige Spracherkennung, ohne das System auf genau diese Person vorher trainieren zu müssen (durch das langweilige Aufsagen von vorgegebenen Trainingssätzen). Oder auch die rasante Entwicklung der Suchmaschinentechnologie. Waren es vor ein paar Jahren noch 10 Links, die als Suchergebnis geliefert wurden, kommen heute kurze, prägnante Antworten, oder der Status meines Fluges, falls die Anfrage als Flugnummer identifiziert wurde. Auch das basiert übrigens zum Teil auf BERT (das von Google entwickelt, der Allgemeinheit aber zur Verfügung gestellt wurde). Ist schon faszinierend das Gebiet.
Das interessanteste Projekt in dieser Hinsicht ist sicherlich ein Antrag für ein Graduiertenkolleg, sehr interdisziplinär, aber auch noch in der Bearbeitung. Watch this space!
Abstrakt betrachtet, ist KI ja nicht neu, viele Konzepte gibt es seit den 40er Jahren und werden auch schon so lange gelehrt. Bisher war es allerdings ein Gebiet, das vor allem von der Informatik bedient wurde. Das hat sich schon geändert, denn gerade die Auswirkungen der KI-Anwendung in allen Lebensbereichen betreffen natürlich nicht nur die Informatik. Das Filtern von Hasskommentaren beispielsweise ist keine rein technische Angelegenheit, denn die Grenze zur Einschränkung der freien Meinungsäußerung kann da schnell mal fließend sein. Daher denke ich, dass bestimmte Aspekte der KI für alle Studienrichtungen von Interesse sein können (bei der Theologie bin ich mir nicht sicher, da kenn ich mich zu wenig aus). Es gibt aber noch eine andere Interpretation der Frage. KI kann durchaus auch in der Hochschulbildung angewandt werden. Das Georgia Tech hat beispielsweise eine technische Assistentin namens Jill Watson, die als Künstliche Intelligenz (aufbauend auf der Technologie von IBM Watson) schon seit Jahren bei der Organisation der Ausbildung hilft. Also kurz: KI wird sicher einen immer größeren Raum in der Hochschulbildung einnehmen.
Wir leisten ganz konkrete Beiträge. Beispielsweise haben wir als Lehrstuhl im Herbst 2019 das Data Science @ Regensburg Meetup ins Leben gerufen, mit dem Ziel, die verschiedensten Interessengruppen zum Thema Data Science etwa einmal monatlich zusammenzubringen, das sind Informatiker genauso wie Psychologen, Akademiker wie auch Leute aus der Industrie, Studenten genauso wie Professoren, alles gut gemischt. Dazu haben wir dann hochkarätige Sprecher, aus der Industrie wie von der Universität. Die Mischung macht’s am Ende. Wir sind auch in der Initiative Artificial Intelligence in Regensburg (AIR) aktiv involviert. Diese Initiative ist von der Stadt ins Leben gerufen worden. Eine Beispielveranstaltung hier ist die Konferenz Women in Data Science (WiDS) 2021 in Regensburg.
Die Informationswissenschaft ist heute wichtiger denn je. Wenn man von künstlicher Intelligenz spricht, gibt es oft die Frage, ob man dem Algorithmus denn vertrauen kann oder soll oder darf. Das Problem ist, dass wir gar nicht so weit gehen müssen, denn wir sehen heute genug Beispiele, wo nicht mal der natürlichen Intelligenz vertraut wird, also Fachleuten, Experten, Institutionen. Als Informationswissenschaftler stehen wir also in der Pflicht zu helfen, Information systematisch und objektiv zu verarbeiten und zu interpretieren. Am Beispiel Corona lässt sich das leicht verdeutlichen: jeder Mensch hat bei uns die Freiheit, sich irgendwelchen Unsinn auszuspinnen oder weiterzuverbreiten. Diese Meinungsfreiheit ist ein Grundpfeiler unsere Demokratie. Problematisch wird es, wenn die Meinung eines Virologen und die eines Quacksalbers, der behauptet, das Virus gäbe es gar nicht (oder es sei Teil einer Verschwörung, der man nur mit Aluhut entkommen kann), als gleichwertig angesehen werden. Genau das ist ein Thema, wo die Informationswissenschaft ihren Beitrag leisten kann und muss. Da gibt es noch viel zu tun.


Herr Kruschwitz, vielen Dank dass Sie sich Zeit genommen haben, uns diese Fragen zu beantworten. Wir wünschen Ihnen noch einen schönen Tag!

Zuletzt bearbeitet am