Workflow zur Erstellung von Trainingsdaten für die KI-Gebäudeerkennung
Uwe Breitkopf and Jonas Bostelmann
Für die KI-Gebäudeerkennung in Luftbildern wird eine große Menge Trainingsdaten benötigt. In der Landesvermessung Niedersachsen (LGLN) wurde dafür ein Workflow unter Verwendung verschiedener Open Source Tools entwickelt. Damit soll der manuelle Aufwand bei der Erstellung der Trainingsdaten möglichst minimiert werden und ein qualitativ hochwertiger Datensatz mit hoher räumlicher Abdeckung entstehen, der die Variabilität der Gebäude in Niedersachsen ausreichend abbildet.
Als DecSecOps-Team des Landesamtes für Geoinformation und Landesvermessung Niedersachsen (LGLN) entwickeln wir eine Anwendung zur „KI-Gebäudeerkennung“ in Luftbildern. Das Ziel dieser Anwendung ist es, Änderungen in den Gebäudedaten im Amtlichen Liegenschaftskataster-Informationssystem (ALKIS) mit Hilfe von KI-detektierten Hausumringen zu finden. Zum Trainieren der KI-Modelle werden Trainingsdaten aus Niedersachsen verwendet. Diese Trainingsdaten bestehen aus 4-Kanal-Orthophotos (DOP) und normalisierten Oberflächenmodellen (nDOM), sowie Hausumringen als sogenannte „Labels“.
Eine manuelle Erstellung und Korrektur dieser Labels ist sehr aufwendig. Aus diesem Grund wurde ein Workflow entwickelt, der aus mehreren Schritten besteht und bereits vorhandene Daten nutzt. Er ermöglicht es Daten in ausgewählten, repräsentativen Bereichen passend zum jeweiligen Luftbild zu editieren. Als Grundlage für diese Labels werden dabei die Gebäude aus ALKIS verwendet. Dies beruht auf der Annahme, dass der Gebäudebestand in den ALKIS-Daten von Niedersachsen größtenteils korrekt ist. Durch eine interaktive Web-GIS-Anwendung in einem Jupyter-Notebook lassen sich mit wenigen Mausklicks Bereiche der Luftbilder anzeigen und mit den vorhandenen ALKIS-Daten überlagern. Somit können die Daten schnell gesichtet und Bereiche identifiziert werden, wo die Gebäude aus ALKIS und das jeweilige Luftbild bereits gut zusammen passen. Diese Bereiche sind 400×400 m bzw. 2000×2000 Pixel groß. Wir bezeichnen sie als „Trainings-Patches“. Die Metadaten dieser „Trainings-Patches“ werden in einer Datenbank gesammelt und bilden einen Pool von möglichen Trainingsdaten.
Teilweise passen die ALKIS-Gebäude nicht zum Luftbild: Es kommt vor, dass Neubauten oder Abrisse noch nicht erfasst sind oder Gebäude bzw. Teile von Gebäuden durch Vegetation verdeckt sind. Damit für das KI-Training nur Labels zum Einsatz kommen, die zu den Luftbildern passen, ist es erforderlich, die vorhandenen Gebäudeumringe zu bearbeiten. Dazu nutzen wir QGIS und die darin vorhandenen Möglichkeiten zum Editieren von Polygonen. Diese Aufgabe ist der aufwendigste Teil des Workflows und wird von einem „Label-Team“ im LGLN durchgeführt. Die Herausforderung besteht hier darin, die Daten der „Trainings-Patches“, bestehend aus Bildausschnitt im Luftbild bzw. nDOM sowie den zu editierenden ALKIS-Polygonen in den QGIS-Client der bearbeitenden Person zu laden. Die visuelle Kontrolle der Daten und die Bearbeitung der Polygone kann auch offline erfolgen. Nach der manuellen Bearbeitung der Polygone müssen die Daten in eine Datenbank geschrieben werden. Dafür wurde ein auf FastAPI-basierender Microservice gebaut, der die Datenbereitstellung und Kommunikation zwischen QGIS-Client und Datenbank durchführt.
In dieser Demo wird der beschriebene Workflow für die Trainingsdaten-Erstellung vorgestellt und die verwendeten Open Source Tools mit ihren interaktiven GIS-Funktionalitäten demonstriert.