Decision Making

Jun.-Prof. Dr. Setareh Maghsudi wurde zum Oktober 2020 auf die W1-Professur "Decision Making" an den Fachbereich Informatik an der Universität Tübingen berufen. Sie wird mit Clustermitteln für ein Forschungsprojekt unterstützt.

Die heutige Welt ist gekennzeichnet durch die massive Zunahme informationsintensiver, vom Menschen gesteuerter Systeme sowie intelligenter Maschinen, die ohne menschliches Zutun funktionieren. In einer dynamischen, stochastischen und kommunikationsbeschränkten Umgebung sind die Geräte und Maschinen zwar unsicher in Bezug auf die Handlungen ihrer Gegenspieler, aber sie interagieren in Echtzeit, um bestimmte Ziele zu erreichen, die einen Konflikt darstellen oder eine Kooperation benötigen könnten. Auf diese Weise schaffen sie große dynamische Netzwerke und produzieren übermäßige Datenmengen, die aus der Beobachtung von Zusatzinformationen und möglicherweise eingeschränkter Rückmeldungen zu Handlungen resultieren.

Wir konzentrieren uns auf die Analyse und Optimierung solcher Systeme durch die Entwicklung effizienter und konvergenter Entscheidungsstrategien. Aus theoretischer Sicht liegen die entwickelten Analysemethoden an der Schnittstelle von Spieltheorie, künstlicher Intelligenz und Data Science. Die propagierten Methoden sind zukunftsweisend und finden nicht nur in konventionellen Forschungsfeldern wie der Ressourcenallokation in drahtlosen Kommunikationsnetzen Anwendung, sondern auch in mehreren innovativen Richtungen, darunter das Internet der Dinge und digitale Plattformen.

                          


| Distributed Machine Learning over Unreliable Networks |

Cluster finanziertes Forschungsprojekt

  •  Projektmitarbeiter: Behzad Nourani Koliji (Doktorand, seit Februar 2021)

Online learning is a variety of sequential decision-making problems under uncertainty. Often, the challenge is envisioned by an agent interacting with an unknown environment. The agent successively selects an action from a set of available actions. The agent obtains some a priori-unknown and state-dependent reward upon choosing each action. A solution to this problem is a decision-making policy to select an action at every round. Often, the evaluation follows in terms of regret bound or discounted accumulated reward.
Graph signal processing (GSP) is a recently-established branch of signal processing. GSP methods handle the excessive amount of data that is collected in various circumstances in a fast and efficient manner.

This project establishes a link between GSP and online decision-making. It develops, adapts, and integrates the GSP tools to enable fast and efficient online learning and decision-making under uncertainty. For example, the graph nodes can represent actions, while each edge shows the relation between the reward generating processes of a pair of actions. The instantaneous rewards of each action then form a time-series at each node of the graph. In this model, relationships such as causality or correlation are inferable by taking advantage of GSP methods. Such information improves the learning rate and reduces the complexity significantly, as they allow to take advantage of mutual information or the structure for efficient sampling. The challenges include dealing with dynamic and time-varying graphs, addressing uncertainties in the graph structure, and managing ultra-large/dense graphs.


Kontakt


Prof. Dr.-Ing. Setareh Maghsudi
Decision Making

Universität Tübingen
Fachbereich Informatik
Maria-von-Linden-Straße 6, 2. OG
Raumnr. 20-5/A19
720740 Tübingen

setareh.maghsudispam prevention@uni-tuebingen.de