Technologie

Die Grundlage: Daten

Datenarten

Realdaten sind Daten, die im realen Straßenverkehr erhoben und aufgezeichnet werden. Diese haben den Vorteil, dass sie die Realität exakt abbilden. Ihre Erhebung aber ist sehr zeit- und kostenintensiv. Auch lässt sich damit nur ein begrenzter Ausschnitt der Realität abbilden, da es unmöglich ist, alle möglichen Verkehrssituationen und -szenarien zu erheben. Vor allem Daten von Unfällen und kritischen Situationen können nicht von Versuchsträgern erhoben werden. Zudem müssen Realdaten sehr aufwendig manuell gelabelt werden, bevor die KI damit zuverlässig trainiert werden kann. 

Durch diese Einschränkungen bei der Verwendung von Realdaten werden für das Training von KI-Funktionen zunehmend synthetisch generierte Daten verwendet. Mit diesen kann man systematisch die vielfältigsten Verkehrssituationen kreieren und gezielt variieren. Ebenso können so gefahrlos auch kritische Situationen modelliert werden. Die Realitätsnähe dieser Daten sowie die Übertragbarkeit der mit solchen Daten trainierten KI-Modelle auf die Wirklichkeit ist jedoch zu untersuchen und nachzuweisen.

Wenn Realdaten nachträglich mit synthetischen Daten erweitert bzw. augmentiert werden, dann spricht man von augmentierten Daten.

Realdaten im Projekt

In KI Data Tooling werden Realdaten von zwei Versuchsträgern deutschlandweit aufgenommen und zusätzlich stationär an zwei Forschungskreuzungen in Braunschweig und Aschaffenburg erhoben. Das Projekt schafft so eine umfangreiche Datenbasis aus Kamera-, Radar- und Lidardaten.

Anhand dieser erhobenen Realdaten werden im Projekt verschiedene Methoden und Tools entwickelt, die zukünftig das automatisierte Labeling und eine effiziente Aufbereitung und Veredelung von Realdaten ermöglichen sollen. Dafür werden u.a. verschiedene Sensor- und Infrastrukturdaten verknüpft und Kontextinformationen nutzbar gemacht, um solche Daten besser analysieren und bearbeiten zu können.

Synthetische Daten im Projekt

Um die aufgeführten Vorteile von synthetischen Daten für das Trainieren von KI-basierten Funktionen optimal nutzen zu können, werden in KI Data Tooling Kamera-, Lidardaten sowie Radardaten synthetisch erzeugt. Auf Grundlage digitaler Kopien der beiden Forschungskreuzungen und eines im Projekt erarbeiteten Szenenkatalogs wird eine Toolchain-Architektur zur systematischen Erzeugung von synthetischen Sensordaten erweitert und implementiert. Das Hauptaugenmerk liegt dabei auf der Entwicklung von Metriken zur Bewertung der Qualität und Konzepten zur Validierung dieser synthetisch erzeugten Daten.

Augmentierte Daten

Um erhobene Realdaten mit synthetisch erzeugten Objekten und Verkehrsteilnehmern erweitern zu können, entwickelt das Projekt entsprechende Augmentierungsverfahren für Kamera-, Lidar- und Radardaten. Parallel werden Metriken erarbeitet, mit denen sich die Güte solch augmentierter Daten systematisch bewerten lässt.

Effizienzpotenziale nutzen

Um die immer größer werdenden Datenmengen optimal nutzen und verarbeiten zu können, untersucht KI Data Tooling verschiedene Aspekte der Effizienz bei der Datenbereitstellung. Neben neuen Methoden zur effizienteren Kompression und Speicherung der Daten geht es hierbei vor allem um die Entwicklung neuer Tools zur Abstraktion der Sensorik sowie zur automatisierten Detektion und Synthetisierung von Corner Cases.

Optimierte KI-Trainingsstrategie

Basierend auf der so geschaffenen Datenbasis werden in KI Data Tooling Trainingsverfahren für KI-basierte Funktionen optimiert und weiterentwickelt. Die Potenziale, die sich aus der Nutzung verschiedener Datenkombinationen von realen, synthetischen und augmentierten Daten ergeben, werden dabei identifiziert und evaluiert. Außerdem wird die Übertragbarkeit auf die Realität geprüft: so werden Trainingsstrategien untersucht, welche KI-Funktionen mithilfe einer Mischung aus synthetischen, realen und augmentierten Daten trainieren. Hierdurch soll sichergestellt werden, dass KI-Funktionen für das hochautomatisierte und autonome Fahren mit den richtigen Daten optimal und effizient trainiert werden können.