News

KI Data Tooling

Neuer Quantisierungsansatz für Learned Image Compression

Durch die immer größer werdenden Datenmengen, die für den Einsatz von autonomen Fahrsystemen benötigt werden, spielt auch der Bereich der Datenkompression eine immer wichtigere Rolle. Die Konsortialpartner des Projekts KI Data Tooling haben diesem Thema nun eine neue Publikation gewidmet.

Aufgrund des steigenden Datenvolumens beim autonomen Fahren (z. B. durch höhere Bildwiederholraten und eine größere Anzahl von Sensoren) müssen neue und effiziente Kompressionsalgorithmen entwickelt werden, um die Speichermedien im Fahrzeug nicht zu überlasten.

Ein kürzlich veröffentlichter Ansatz, der auf dem CVPR-Workshop Challenge on Learned Image Compression (CLIC) am 19. Juni vorgestellt wurde, befasst sich mit einem spezifischen Teil eines Bildkompressionsverfahrens, nämlich der Quantisierung. Bei der Learned Image Compression wird eine Autoencoder-Architektur verwendet, die zunächst die räumliche Auflösung des Bildes im Encoder reduziert (die resultierende Datendarstellung wird als latenter Raum bezeichnet) und sie dann im Decoder in ihre ursprüngliche Form zurückführt, um das Bild während der Dekomprimierung zu rekonstruieren. Die räumliche Verkleinerung reduziert bereits die Größe des latenten Raums. Darüber hinaus wird die Auflösung des Wertebereichs des latenten Raums durch Quantisierung weiter reduziert, was wiederum zu einer Verringerung der Größe führt. Da der latente Raum dann diskret ist, kann als dritter Schritt die Entropiekodierung verwendet werden, um Redundanzen, die möglicherweise noch in den Daten vorhanden sind, auszunutzen, um die erforderliche Größe der erzeugten Bitfolgen erneut zu verringern. Diese Bitfolgen werden schließlich z. B. auf einer Festplatte gespeichert oder über einen Übertragungskanal gesendet.

Ein wichtiger Unterschied zur etablierten Basismethode besteht darin, dass der neue Ansatz eine Vektorquantisierung verwendet (die prinzipiell zu geringeren Quantisierungsfehlern führt als eine skalare Quantisierung) und kein Codebuch benötigt. Die Publikation zeigt auch, wie der Quantisierungsansatz mit einem Feature-Map-Maskierungsmechanismus verwendet werden kann, um die Bitrate nach dem Training des Modells während der Inferenz anzupassen. Dies ist in der Praxis besonders interessant, da es bedeutet, dass nur ein einziges Modell trainiert werden muss, anstatt ein Modell pro Bitrate. Dies wäre auch mit der Basismethode möglich, jedoch kann sich der vorgeschlagene Quantisierer besser an den Anwendungsfall der adaptiven Bitratenkompression anpassen.

Als Teil der kompletten Datenlösung, die im KI Data Tooling entwickelt wird, spielen die Forschungs- und Entwicklungsaktivitäten im Bereich der gelernten Bildkompression eine wichtige Rolle im Projekt. Die neue Version stellt somit einen wichtigen Baustein zur Erreichung der Projektziele dar.

Bild: KI Data Tooling