Aktuelles
17.08.2018
Warum maschinelles Lernen in der Bodenkunde zum Einsatz kommt
Nachhaltigkeit erfordert eine belastbare Datengrundlage und den Willen zur interdisziplinären Zusammenarbeit. Die Bewertung und Verarbeitung bodenkundlicher Informationen im Kontext der Nachhaltigkeit geht in der Qualität Hand in Hand mit den uns zur Verfügung stehenden Daten. So dienen zum Beispiel verlässliche und hoch-aufgelöste bodenkundliche Informationen der objektiven Sicherung der nachhaltigen Ertragsfähigkeit unserer Böden. Die Erhebung der dafür notwendigen Informationen ist zumeist sehr kostenaufwendig und steigt mit der Auflösung und der Größte der Untersuchungsregion. Insbesondere in Regionen mit einer geringen Abdeckung wichtiger bodenkundlicher Grundlagendaten sowie geringen finanziellen Mitteln zur flächendeckenden Erfassung ist der Einsatz neuer Verfahren und Techniken erforderlich. Die Anwendung von Verfahren des maschinellen Lernens im bodenkundlichen Bereich, häufig als "Digital Soil Mapping" bezeichnet, stellt einen wichtigen und wachsenden Forschungszweig dar, der sich insbesondere mit der Bereitstellung essentieller bodenkundlicher Kenngrößen unter Verwendung von zumeist überwachten nicht-linearen Klassifikations- und Regressionsverfahren widmet. Dabei zeichnet sich Tübingen als ein Pionier der ersten Stunde aus und beschäftigt sich nun schon seit 15 Jahren mit der Anwendung von Techniken des Maschinellen Lernens.
Thomas Scholten und Karsten Schmidt
Bessere Bodenkarten für die Tropen - durch maschinelles Lernen werden alle verfügbaren Daten verknüpft
Neue Publikation am Beispiel Burkina Faso
Böden bilden eine der wichtigsten Lebensgrundlagen für den Menschen. Nahrungsmittelproduktion, Lebensraum für Pflanze und Tier sowie das biologische und chemische Recycling von Nährstoffen sind insbesondere in Ländern mit stark verwitterten tropischen Böden und einer in weiten Teilen auf die Selbstversorgung der Menschen ausgerichteten Landwirtschaft zentrale Funktionen. Allerdings besteht gerade hier oft ein ausgesprochener Mangel an Bodeninformationen, die für ein nachhaltiges und effizientes Landmanagement unabdingbar sind. Häufig liegen lediglich wenige und ungleich im Raum verteilte Altdaten vor, oft noch aus Kolonialzeiten. Noch heute basieren viele Planungen daher auf der Weltbodenkarte aus den 1970er Jahren mit geringer Auflösung im Maßstab von 1 zu 1,5 Millionen – ein Zentimeter auf der Karte entspricht 15 Kilometern in der Natur. Dr. Karsten Schmidt, Dr. Thorsten Behrens und Professor Thomas Scholten von der Universität Tübingen und Kollegen von der Universität Bonn beschreiben erneut in einem neuen Aufsatz, wie mithilfe von maschinellem Lernen (ML) eine deutlich genauere und räumlich hoch aufgelöste Bodenkarte für ein Wassereinzugsgebiet in Burkina Faso berechnet werden kann.
Eine wichtige methodische Neuerung der sonst gängigen Prozessstruktur war die Berücksichtigung des potentiellen Kartierfehlers sogn. Source Error in den bestehende Altdaten und den damit verbundenen Einflüssen auf die Modellierung. Dabei konnte die inhärente Beziehung der bodenkundlichen Information zu seinen beschreibenden Umweltvariablen objektiv genutzt werden, um den Altdatenbestand zu bereinigen. Die so bereinigten Altdaten ermöglichten eine wesentliche bessere flächendeckende Modellierung der bodenkundlichen Information. Dabei werden in gängigen Ansätzen flächendeckende Umweltvariablen wie z.B. weltweit verfügbare Satellitendaten zur Topografie, zum Klima und zur spektralen Reflexion der Erdoberfläche mit den bodenkundlichen Daten modellhaft verknüpft und für die räumliche Vorhersage genutzt. Ein wichtiger Nebeneffekt in der Nutzung der ML-Verfahrensgruppe bei der Erzeugung des digitalen Kartenprodukts ist die Möglichkeit der Identifikation entscheidender Prozesskomponenten, die für die Bodenverbreitung wesentlich sind. In der Studie konnte mit dem ML-Verfahren Random Forests und den angesprochenen Anpassungen im Altdatenbestand die Bodenkarte für das Testgebiet in Burkina Faso berechnet werden. Dieses Klassifikationsverfahren besteht aus mehreren randomisierten Entscheidungsbäumen und lernt anhand der zur Verfügung stehenden Datensätze Entscheidungsregeln, in unserem Fall für die räumliche Zuweisung von Referenzbodenformen. Am Ende ist eine hoch aufgelöste Bodenkarte entstanden, die um bis zu 35 Prozent genauer ist, als es mit bislang üblichen statistischen Verfahren möglich war.
- Hounkpatin, O.K.L., Schmidt, K., Stumpf, F., Forkuor, G., Behrens, T., Scholten, T., Amelung, W., Welp, G. (2018): Predicting reference soil groups using legacy data: a data pruning and Random Forest approach for tropical environment (Dano catchment, Burkina Faso). Scientific Reports 8:9959. doi:10.1038/s41598-018-28244-w