News

KI Data Tooling

Patentanmeldung der Fachhochschule Aschaffenburg zur Abstraktion von Sensordaten

KI Data Tooling hat seine erste Patentanmeldung eingereicht. Hannes Reichert (Hochschule Aschaffenburg, UAB) und Konrad Doll (UAB) berichten über die Motivation, Designüberlegungen und ihre allgemeine Vision von Sensordatenabstraktionsmethoden in automobilen Wahrnehmungssystemen.

Lasst uns mit der Motivation beginnen: Was ist Sensordatenabstraktion, und warum ist sie notwendig?

Das Sammeln und Aufbereiten der Daten für KI-Funktionen erfordert einen erheblichen Zeit- und Entwicklungsaufwand. Oft werden die Sensoreinstellungen nach der Ersteinrichtung eines Erfassungsfahrzeugs nicht mehr geändert. Dies führt zu einem Mangel an Daten über die Variabilität der verwendeten Sensoren. Diese Variabilität ist jedoch zwingend erforderlich, um eine Verzerrung der KI-Funktionen auf den/die verwendeten Sensor(en) zu vermeiden. Derzeit ist es nicht trivial, einen Sensor nach dem Entwurf der KI-Funktionen zu wechseln.

An dieser Stelle kommt die Sensordatenabstraktion ins Spiel. Sensordatenabstraktion ist ein Arbeitspaket im KI Data Tooling, das darauf abzielt, diese Sensorverzerrung zu reduzieren.

Was ist euer Ansatz?

Eine Projektion (d. h. Bilder) führt zu Mehrdeutigkeiten in Größe und Form von Objekten, die durch die verwendeten Sensoren verursacht werden. Dies überspannt einen enormen Raum, wie Objekte wie Fußgänger in Sensordaten dargestellt werden können. Während wir uns auf die Generalisierungseigenschaften von KI-Funktionen für das Erscheinungsbild (z. B. Kleidung) verlassen, haben wir beschlossen, die Projektionseigenschaften zusammen mit den Sensordaten zu kodieren und als Kontext zu verwenden.

Kurz gesagt, wir bestimmen für jedes Pixel eine Ablenkungsmetrik, die den Winkel angibt, in dem ein Lichtstrahl auf den Sensor trifft, relativ zur Hauptachse des Sensors. Wir können diese Ablenkungsmetrik als einen zusätzlichen Bildkanal behandeln und mit den Sensordaten durch Faltungsschichten verarbeiten. Dies ermöglicht die Verarbeitung mit faltenden neuronalen Netzen. Außerdem wird dadurch der Möglichkeitsraum begrenzt, was zu einer schnelleren Konvergenz und einer besseren Generalisierung auf neuartige Sensoren mit unterschiedlichen Eigenschaften führt.

Und schließlich: Was sind die Anwendungsbereiche?

Ursprünglich haben wir die Methode für Kameradaten entwickelt, zu denen wir gerade an einer Veröffentlichung arbeiten. Es hat sich aber herausgestellt, dass diese Methode auch für LiDAR-Daten gut geeignet ist. Die Verwendung der Tiefenmaße des LiDAR zusammen mit der Ablenkungsmetrik erlaubt es, LiDAR wie eine Kamera zu behandeln und ermöglicht die Verarbeitung mit modernen Bildverarbeitungsmethoden unter Beibehaltung der 3D-Informationen. Damit nähert sich die Verarbeitung von LiDAR-Daten dem Stand der Technik bei Kameradaten an.

Bild: TH Aschaffenburg