Data Literacy für Hochschulen

Symbolic photo: in a university's library

Neuronal web with the main components of our data literacy education program

Unsere moderne Welt ist voller neuer und durchaus sensibler Datenbestände, in denen sowohl wissenschaftliche und wirtschaftliche Perspektiven als auch gesellschaftliche Risiken verborgen sind. Data Literacy wurde so zu einer Schlüsselkompetenz für viele Fachbereiche unserer Universität.

Mit einer fakultätsübergreifenden Data-Literacy-Initiative wollen wir unsere Studierenden in die Lage versetzen, gekonnt, kritisch und verantwortungsbewusst mit modernen Daten zu arbeiten. Unsere Absolventen werden so für den Arbeitsmarkt kompetitiver, unser Lehrangebot insgesamt attraktiver und der Ausbildungs-, Forschungs- und Industriestandort Ostbayern nachhaltig stärker.

Unser Ziel ist einfach: Mehr Data Literacy für mehr Studierende. Kein Fachbereich ist dabei ausgeschlossen. Unsere Strategie ist einfach: Data Literacy braucht einen guten Nährboden, um wachsen zu können. Wir wollen deshalb in Nährstoffe investieren, zu denen vor allem zählen:

Alltäglicher Kontakt zu datengetriebener moderner Wissenschaft
Stärkung der Kernkompetenzen Programmierung und Statistik
Gute Abstimmung zwischen Lehrmodulen
Förderung fachübergreifender Zusammenarbeit
Informiertes Verantwortungsbewusstsein für sensible Daten
Studentische Eigeninitiative
Spaß

Data Literacy Education

Data Literacy betrifft alle: Kein Fachbereich unserer Universität kann darauf verzichten, sich den Herausforderungen der Digitalisierung und der damit einhergehenden Datenflut zu stellen. Umgekehrt hat jeder Fachbereich etwas beizutragen, von den empirischen Wissenschaften, über Mathematik und Rechtswissenschaften, bis hin zur Ethik und Theologie.

Auch wenn sich Fragestellungen stark unterscheiden, die Methoden sind doch oft die gleichen, egal wofür man sie einsetzt. Und selbst wenn man sie nicht selbst nutzt, sondern rechtlich, soziologisch, psychologisch oder ethisch bewerten will, muss man sie ja doch zunächst verstehen. Deshalb wollen auch wir die Data Science-Kompetenz in all ihren Facetten über unsere Fakultäten hinweg bündeln.

Um den Bezug des Lehrangebotes zu den Themen KI und Big Data besser darstellen zu können, haben wir Studierende der Universität Regensburg befragt. In der Umfrage wurden unter anderem Fragen zu den Studiengängen und den vermittelten Inhalten gestellt.

Motivation

Um Studierenden zu zeigen, was sie in ihren jeweiligen Fächern mit Data Science-Methodik erreichen können, werden wir in laufende fachspezifische Grundvorlesungen Teaser im Umfang von 1-2 Doppelstunden integrieren. Um ihnen zu vermitteln, dass Data Science von interdisziplinärerem Austausch lebt, entwickeln wir eine Ringvorlesung, in der Lehrende unterschiedlicher Fachbereiche ihren Zugang zur Data Science darlegen.

Bislang haben wir Zusagen für Beiträge zu folgenden Themen:

Stilometrie (Literaturwissenschaft)
Fußgängernavigationssystem der Universität
Alexa
Suchverhalten im Internet
Schülerverhalten im Unterricht (Lehramt)
Genomstrukturdaten

personalisierten Therapieentscheidungen (Medizin)
Proteinstrukturdaten
High Performance Computing und Künstliche Intelligenz
Brain-Imaging (Neuro-Science)
ökologische Modelle

Um ergänzende Beiträge unter anderem aus Wirtschaftsinformatik, Marketing, Medieninformatik, Psychologie, sowie zu rechtlichen und
ethischen Aspekten bemühen wir uns gerade.

Teaser und Ringveranstaltung sollen auch Studierende für den Inkubator gewinnen.

Data 101

Dies ist der einzige für beide Zertifikate fest vorgeschriebene Kurs und basiert auf derSwirl Umgebung „Learning R in R“. Studierende erwerben darin die Kompetenz, Data Science-Problemstellungen in R zu bearbeiten. Dazu werden unsere Studierenden echte Daten analysieren: von Fußballergebnissen über die Clinton-Emails bis hin zur bakteriellen Zusammensetzung der Darmflora.

Im Vordergrund dieses Kurses stehen nicht statistische Verfahren und deren mathematische Grundlagen, sondern die Arbeit mit Daten am Computer. Ein wichtiges Ziel ist es, die Studierenden weg von Tools wie Excel hin zu Programmiersprachen wie R oder Python zu führen, die nicht nur flexibler und mächtiger sind, sondern auch die Analysen eindeutig und reproduzierbar dokumentieren. Die Fallbeispiele sind daher absichtlich so gewählt, dass sie in Excel nicht unter Kontrolle zu bringen sind. Einen Prototyp dieses Kurses haben wir zusammen mit fortgeschrittenen Studierenden entwickelt und bereits für ein Semester mit Bachelorstudenten unterschiedlicher Fachbereiche erprobt.

Kernkompetenzen

Darunter verstehen wir Programmierung und statistisches Denken und bauen auf das existierende Lehrangebot auf. In dafür konzipierten Kursen werden den Studierenden die fundamentalen Konzepte und Denkweisen aus Informatik und Statistik vermittelt. Bei der Programmierung setzen wir auf die Sprachen Python und R. Entsprechende Kurse für Anfänger existieren bereits und müssen nur auf den Bedarf nachfolgender Kurse abgestimmt werden. Anstelle von Fortgeschrittenenkursen werden wir auf die ständige Nutzung der Sprachen in Datenanalyseprojekten setzen. Hierbei spielen Konnektoren – Lehrveranstaltungen, die Data Science mit einem Anwendungsfach verbinden (siehe Konnektoren) – eine entscheidende Rolle. Statistikkurse gibt es in vielen Fachbereichen jeweils abgestimmt auf die Bedürfnisse und Traditionen des Fachs. Wir werden mindestens einen dieser Kurse für Hörer aller Fakultäten öffnen.

Fortgeschrittene Methoden

Während beim kleinen Daten-Latinum die Kernkompetenzen, der Data 101 Kurs und die Konnektoren im Mittelpunkt stehen, soll das große Daten-Latinum tiefer greifen und Mathematik nutzen. Aktuelle Stellenausschreibungen enthalten Stichworte wie: Maschinelles Lernen, Künstliche Intelligenz, Deep Learning, Big Data, Data Mining, Bildanalyse, Zeitreihenanalyse, Regression, Räumliche Modelle, Bayes’sche Verfahren oder Simulation komplexer Systeme. Dies sind ausnahmslos fortgeschrittene Techniken, deren Erlernen auf einer grundlegenden Ausbildung in Datenmanagement, Programmierung, und Statistik zwar aufbauen, hier jedoch nicht enden. Wir wollen deshalb auch ein attraktives Angebot an fortgeschrittenen Methodenkursen anbieten. Vorgesehen sind Module von Daten-Visualisierung über maschinelles Lernen bis hin zu einem Kurs in der Machine Learning-Software TensorFlow und Praktika im Programmieren eines Super-Computers. Viele Kurse existieren bereits verstreut über die Fachbereiche und müssen lediglich für die Vorkenntnisse der Studierenden des Zertifikat optimiert werden.

Der Schlüssel zu fortgeschrittenen Data-Science-Methoden sind Mathematikkenntnisse, insbesondere aus der Linearen Algebra, der Wahrscheinlichkeitstheorie, und aus Numerik und Optimierung. Wir planen, einen eigenen Kurs für die Data-Science-Ausbildung zu entwickeln, indem die Mathematik immer direkt an Data Science-Probleme gekoppelt ist. Er soll Nicht-Mathematikern einen Zugang zum großen Daten-Latinum schaffen.

Konnektoren

Diese Module sind in den Fachdisziplinen verankert, greifen Data-Science-Methoden auf und wenden sie an. Wie bei den Methodenkursen existieren auch in den Fakultäten diverse Veranstaltungen, die als Konnektoren funktionieren können, und wieder gibt es die Chance, diese aufbauend auf einer gemeinsamen Ausbildung in den Kernkompetenzen und den fortgeschrittenen Methoden deutlich effizienter zu gestalten.

Konnektoren setzen zumindest die Teilnahme an Data 101 voraus, in vielen Fällen aber noch mehr Module etwa aus den Kernkompetenzen. Die Beschreibung der aktuellen Konnektoren kann auf derwebsite der Informationswissenschaft eingesehen werden.

Gesellschaftlicher Kontext

Die sechste Säule ist ein Querschnittsthema, das wir nicht mit klassischen Lehrformen, sondern in einem innovativen Konzept zusammen mit hochschulexternen Akteuren behandeln möchten. Es wird im Detail im Abschnitt über den Inkubator beschrieben.

Data-Science Zertifikat

Wir entwickeln eine Data-Science-Ausbildung für Studierende aller Fakultäten, in der sie lernen, moderne Data Science-Methodik in ihren Fachdisziplinen einzusetzen. Dabei können sie zwei abgestufte Zertifikate erwerben:

Kleines „Daten-Latinum“

Für Studierende ohne Vorkenntnisse

Umfang

Ringvorlesung: Data across the sciences
Data 101
2 Kurse in den Kernkompetenzen
1 Konnektor

Großes „Daten-Latinum“

Für Studierende mit Grundlagenwissen in Programmierung, Statistik oder Maschinellem Lernen.