Wie können immer größere wissenschaftliche Datenmengen verarbeitet und ausgewertet werden? Und wie kann man Erdbeobachtungsdaten mit Messungen am Boden sinnvoll kombinieren und damit neue Informationsquellen erschließen? Im Querschnittsprojekt Big-Data-Plattform erarbeiten Wissenschaftler des Deutschen Zentrums für Luft- und Raumfahrt (DLR) Methoden für den Zukunftsbereich Big-Data-Science. In dem interdisziplinären Forschungsprojekt arbeiten 21 DLR-Institute aus den Forschungsbereichen Raumfahrt, Luftfahrt, Verkehr, Energie und Sicherheit zusammen. Das Projekt hat eine Laufzeit von vier Jahren und ein Finanzvolumen von über 21 Millionen Euro.
Abb.: Die Vernetzung von Daten kann sogar bei der Parkplatzsuche helfen. (Bild: DLR / IMF)
Die Menge an wissenschaftlich verwertbaren Daten wächst jedes Jahr enorm. Erst effektive Datenanalysen oder intelligente Vernetzungen ermöglichen die systematische Auswertung und Nutzung dieser Daten. Gleichzeitig ist der Umgang mit großen Datenmengen auch eine große Herausforderung. „Big-Data-Science ermöglicht eine Vielzahl neuer Forschungsansätze und ist ein Schlüssel des digitalen Wandels, der sich in der gesamten Gesellschaft vollzieht – inklusive der Wirtschaft. Mit dem Querschnittsprojekt Big-Data-Plattform, das in der Strategie zur Digitalisierung fest verankert ist, erarbeitet das DLR Methoden, um aus Daten gesellschaftlich relevantes Wissen zu erzielen", sagte Pascale Ehrenfreund, Vorstandsvorsitzende im DLR. „Wir verfügen bereits in vielen Bereichen über große Erfahrungen im Bereich Big-Data-Science, zum Beispiel in der Fernerkundung, in der Verkehrsforschung und bei detaillierten Computersimulationen in der Luftfahrt. Mit dem breit aufgestellten Projekt Big-Data-Plattform können wir Synergieeffekte aus unseren unterschiedlichen Forschungsbereichen hervorragend nutzen."
Ein wichtiges Ziel des Projekts ist die Entwicklung von Methoden zur Analyse großer Datensätze. Zudem arbeiten die Forscher an Datenmanagementtechniken, die das Zusammenführen von heterogenen Datensätzen ermöglichen. „Das DLR arbeitet schon lange in diesem Forschungsbereich und hat große Erfahrungen bei der Interpretation großer Datensätze", betont Rolf Hempel, Projektkoordinator und Leiter der DLR-Einrichtung Simulations- und Softwaretechnik. „Durch die Verknüpfung unterschiedlicher Datensätze, etwa von Satellitenbildern mit Gebäudeaufnahmen, die in den sozialen Medien veröffentlicht wurden, können wir neue, bislang nicht erkennbare Informationen ableiten. Dadurch lassen sich zum Beispiel unterschiedliche Stadtgebietstypen viel besser voneinander unterscheiden – eine Information, die beispielsweise für die Stadtplanung genutzt werden kann."
Ein weiterer Fokus im Querschnittsprojekt Big-Data-Plattform liegt auf der Erforschung von Analyseverfahren, die „Data-Mining" und maschinelles Lernen nutzen. Data-Mining umfasst dabei die Analyse von Daten mit dem Ziel, Informationen und Gesetzmäßigkeiten aufzuspüren. Beim maschinellen Lernen sollen hingegen nicht nur Muster und Gesetzmäßigkeiten erkannt werden, das System soll vielmehr seine Fähigkeiten durch Verarbeitung von Trainingsdatensätzen weiterentwickeln. In der Erdbeobachtung beispielsweise können Datensätze mit selbstlernenden Systemen besser und schneller interpretiert werden. Dadurch lassen sich Gebäude, Straßen oder auch Vegetationstypen aus Luft- und Satellitenbildern wesentlich genauer ableiten. Maschinelle Lernverfahren bilden ferner einen wichtigen Baustein zum Aufbau von Systemen im Bereich „autonomes Fahren" und „intelligente Mobilität".
Ein konkretes Anwendungsbeispiel ist die hochgenaue Ableitung von Straßen und Straßenmarkierungen, mit der in einer Echtzeit-Analyse freie Parkplätze in einer Stadt herausgefiltert werden können. Die Echtzeit-Analyse von Bilddaten für ein schnelles Krisenmanagement ist eine weitere konkrete Anwendung, die im Projekt Big-Data-Plattform bearbeitet wird: Lagedaten und andere spezifische Informationen bieten Rettungskräften eine wichtige Unterstützung bei ihren Einsätzen. Intelligente Datenanalysen mit Methoden des maschinellen Lernens kommen zudem auch in der Klimainformatik zum Einsatz.
DLR / DE