attempto online
17.11.2022
Data Science und Machine Learning in den Wirtschaftswissenschaften
Ein Interview mit dem neuen Juniorprofessor Michael Knaus
Seit Wintersemester 2022/23 haben Sie eine Tenure-Track Professur für Data Science in Economics. Wurden Sie im Studium an den Universitäten Hohenheim, Bologna sowie durch Ihren PhD in Economics and Finance an der Universität St. Gallen gut auf die nun vor Ihnen liegenden Aufgaben vorbereitet?
In Hohenheim habe ich die Ökonometrie entdeckt, nachdem ich zuvor eigentlich Marketing vertiefen wollte. In Bologna hat sich mein Interesse an Causal Inference herauskristallisiert. In St. Gallen konnte ich meinen PhD diesem Thema widmen. Während der Dissertation kam die Frage auf, inwiefern dieses „Machine Learning“ relevant für Causal Inference und Economics sein könnte. Dieses Thema habe ich seitdem beackert und werde es auch in Zukunft tun. Deshalb glaube ich, dass ich forschungstechnisch etwas zu „Data Science in Economics“ beitragen kann. Summa summarum fühle ich mich durch meinen bisherigen Weg gut vorbereitet und den Rest werde ich versuchen zu lernen.
Was war ausschlaggebend für Ihre Entscheidung, nach Tübingen zu kommen?
Einem Ruf an eine Universität zu folgen, die sowohl die geographischen, als auch die akademischen Kriterien erfüllt, die meine Frau und ich als ideal definiert haben. Mein Vertrag in St. Gallen war befristet. Die neue Stelle ist ein Tenure-Track. Das heißt, wenn ich mich gut anstelle in Forschung und Lehre, bekomme ich die Professur auf Lebenszeit, auf die ich seit langem hin arbeite. Zusätzlich gibt es mit dem Exzellenzcluster „Machine Learning“, dem Max-Planck-Institut für Intelligente Systeme und der Cyber Valley Initiative ein in Europa einzigartiges Umfeld mit möglichen Anknüpfungspunkten für meine Forschung.
Was können die Tübinger Studierenden von Ihnen erwarten?
Wir sind umgeben von Buzzwords wie Big Data, Machine Learning und AI. Ich möchte einerseits diesen Hype in den Vorlesungssaal tragen und Studierende für die spannende und zunehmend relevante Welt der Datenanalyse zur Unterstützung von Entscheidungen begeistern. Sie lernen von Machine Learning inspirierte Methoden, die bisher in keinem Lehrbuch besprochen werden. Gleichzeitig möchte ich sie dafür sensibilisieren, dass eine fancy Methode allein noch keine glaubwürdige Analyse hervorbringt. Wir benötigen den Kontext zu unseren Daten und müssen wissen, unter welchen Annahmen wir welche Schlüsse ziehen können. Mein Ziel ist es, dass Studierende nach meinen Kursen zielgerichtete Datenanalysen durchführen sowie Datenanalysen von anderen kritisch hinterfragen können.
Was erwarten Sie von den Tübinger Studierenden?
Keine Angst vor Theorie und Coden. Beides benötigen wir, um sinnvolle Datenanalysen zu erstellen. Offenheit bezüglich neuer Methoden, die noch in den Kinderschuhen stecken. In dieser Hinsicht Nachsicht mit dem Dozenten, wenn manche Fragen noch nicht abschließend beantwortet werden können, weil es sich um ein aktives Forschungsfeld handelt. Konstruktive Kritik. Ich experimentiere gerne mit neuen Prüfungs- und Vorlesungsformaten. Dabei ist vielleicht nicht alles, was ich cool finde hilfreich für die Studierenden. Nur gemeinsam können wir herausfinden, was für beide Seiten funktioniert und was nicht.
Was ist das Kernthema Ihrer Forschung?
Ich arbeite an der Entwicklung und Anwendung von Methoden, die die Wirkung von bestimmten Maßnahmen messen und vorhersagen können. Nehmen wir als Beispiel Jobchancen von Arbeitssuchenden. Mit klassischen Machine Learning-Methoden und den entsprechenden Daten kann ich vorhersagen, wie lange eine Person vermutlich arbeitssuchend bleibt. Dies ist zwar spannend, aber ich kann daraus keine Empfehlung ableiten, welche Maßnahmen die Arbeitslosigkeit verkürzen könnten. Dies ist ein kniffligeres Problem. Nehmen wir als potenzielle Maßnahme einen Computerkurs. Für Arbeitssuchende, die solch einen Kurs besucht haben, können wir zwar beobachten, wann sie wieder beschäftigt wurden. Wir wissen aber nicht, wann sie einen Job gefunden hätten, wenn sie den Kurs nicht besucht hätten. Umgekehrt wissen wir nicht, was mit Arbeitssuchenden ohne Computerkurs passiert wäre, wenn sie doch an einem teilgenommen hätten. Meine Forschung beschäftigt sich mit kausalem Machine Learning, welches trotz fehlender Informationen über diese kontrafaktischen Verläufe Vorhersagen treffen kann, ob sich die Arbeitslosigkeit einer Person durch einen Computerkurs verlängert oder verkürzt. Dies ermöglicht es Maßnahmen zu personalisieren. Diese Methoden können z.B. auch für personalisiertes Marketing oder personalisierte Medizin verwendet werden. Das ist es, was mein Forschungsfeld so spannend und zugleich interdisziplinär macht.
Das Interview führte Natalie Schnabel