attempto online Forschung
25.06.2021
Bessere Entscheidungen, mehr Kontrolle: „Best Paper Award“ für Tübinger Forscher
Zwei Cyber Valley Forschende ausgezeichnet für beste wissenschaftliche Arbeit bei weltweit renommierter Konferenz
Großer Erfolg für zwei KI-Wissenschaftler aus dem Cyber Valley Ökosystem: Michael Niemeyer, Doktorand am Max-Planck-Institut für Intelligente Systeme, und Prof. Dr. Andreas Geiger von der Universität Tübingen wurden für ihre Arbeit „GIRAFFE: Representing Scenes as Compositional Generative Neural Feature Fields“ bei der diesjährigen Conference on Computer Vision und Pattern Recognition (CVPR) mit dem „Best Paper Award“ geehrt.
Bei dem Paper der beiden Tübinger Wissenschaftler handelt es sich um Grundlagenforschung auf dem Gebiet des maschinellen Sehens. Niemeyer und Geiger beschreiben darin eine von ihnen entwickelte Methode, mit der es Computern nun erstmals möglich ist, verschiedene dreidimensionale Objekte auf zweidimensionalen Bildern (z. B. Fotos) selbständig zu identifizieren.
„Unser Ziel ist, dass Computer selbst erlernen, wie Bilder – wir sprechen hier von Szenen – aufgebaut sind“, sagt Niemeyer, Hauptautor der Arbeit und Promotionsstudent an der International Max Planck Research School for Intelligent Systems (IMPRS-IS), der Cyber Valley Graduiertenschule. „Der Computer soll also erkennen, welche dreidimensionalen Objekte sich auf einem Foto befinden, das heißt wie eine Szene strukturiert ist.“ Während die meisten gängigen Ansätze auf zweidimensionalen Datensätzen beruhen und die abgebildeten Szenen nicht dreidimensional erfassen, erkennt das neue Modell von Niemeyer und Geiger, GIRAFFE, die abgebildeten Objekte dreidimensional und ermöglicht so alle möglichen unterschiedlichen Blickwinkel auf die selbe Szene.
Konkret bedeutet das: Ein einfaches Foto, auf dem beispielsweise ein Auto vor einem Haus parkend abgebildet ist, kann als Basis dienen, um das Auto nicht nur von vorne, sondern auch aus weiteren Blickwinkeln vor dem Haus zu betrachten. Darüber hinaus kann die Position des Autos im Bild beliebig verschoben werden und dadurch jeweils unterschiedliche Teile des Hauses verdecken bzw. den Blick darauf freigeben. „Das meinen wir mit ‚compositional‘ – unser Computermodell erfasst die Struktur der abgebildeten Szene. Es erkennt das Auto im Vordergrund als ein Objekt und das Haus im Hintergrund als ein weiteres“, sagt Niemeyer.
Sehen Sie hier mehr über die Funktionsweise von GIRAFFE im Video: https://youtu.be/fIaDXC-qRSg
Darüber hinaus bietet GIRAFFE mehr Kontrolle bei der Bildgenerierung. So kann beispielsweise die Form eines abgebildeten Objekts beliebig verändert werden. Dies könnte künftig unter anderem bei der Erzeugung virtueller Umgebungen für eine deutlich realistischere Darstellung sorgen. „Unser Paper ist eine Grundlagenarbeit“, betont Niemeyer. „Andere Forschende könnten auf dieser Basis sicherere KI-Anwendungen konstruieren, da diese nun, dank eines besseren Verständnisses ihrer Umgebung, bessere Entscheidungen treffen können.“ Ein denkbares Anwendungsfeld wäre hier beispielsweise das autonome Fahren, bei dem die Computersysteme der Autos künftig besser erfassen könnten, welche Objekte sich in ihrer Umgebung befinden – und so präzisere Rückschlüsse auf die Eigenschaften und Verhaltensweisen dieser Objekte ziehen können. Zudem ermöglicht Niemeyer und Geigers Modell eine verbesserte künstliche Erzeugung von Daten, da es nur zweidimensionale Fotos als Ausgangsbasis benötigt. Demnach könnten KI-Systeme künftig in einer künstlich erzeugten Umgebung trainiert werden.
Die CVPR ist eine der prestigeträchtigsten internationalen Forschungskonferenzen überhaupt und gilt als die wichtigste Fachkonferenz insbesondere im Bereich des maschinellen Sehens. Lediglich etwa ein Viertel der rund 7.000 eingereichten Fachartikel werden zur Konferenz zugelassen. Mit insgesamt 27 akzeptierten Beiträgen und vier Best-Paper-Nominierungen sind Cyber Valley Forschende in diesem Jahr auf der CVPR besonders stark in der Weltspitze der KI-Grundlagenforschung vertreten.
„Meine Forschungsgruppe hat bereits mehrere Arbeiten veröffentlicht, die sich mit dem Erlernen von geeigneten 3D-Repräsentationen mit neuronalen Netzen befassen und die in der Computer-Vision-Community vielfach beachtet wurden“, sagt Geiger. „Darauf baute auch das nun ausgezeichnete Paper auf.“ Trotzdem haben Geiger und Niemeyer nicht mit dieser besonderen Auszeichnung bei der CVPR 2021 gerechnet. „Dass unser Paper zur Konferenz zugelassen wurde, war schon ein Erfolg an sich“, sagt Niemeyer. „Wir sind wirklich sehr überrascht, dass unsere wissenschaftliche Arbeit nun unter all den Einreichungen als die beste ausgezeichnet wurde. Umso mehr freuen wir uns über diese herausragende Anerkennung!“
Weitere Informationen zur Originalpublikation: https://autonomousvision.github.io/giraffe/
Pressekontakt:
Lennart Schmid
Pressereferent Cyber Valley
c/o Tübingen AI Research Building
+49 160 91289359
lennart.schmidspam prevention@cyber-valley.de