Daten aus realen Verkehrsszenarien zu sammeln, zu speichern und weiterzuverarbeiten ist aufwändig, teuer und verbraucht sehr viel Energie. Hinzu kommt, dass die real eingefahrenen Daten oft fehlerhaft sind, gefährliche Grenzsituationen im Verkehr kommen in Realdaten wiederum kaum vor, sind aber kritisch für die Verifizierung der KI-Modelle. Mit Hilfe synthetischer Daten können reale Daten so ergänzt und erweitert werden, dass relevante Daten und Datensets für das KI-Training entstehen können.
Ein Konsortium aus neun Partnern (OEMs, Automobilzulieferer, Forschungseinrichtungen, Technologiepartner) entwickelt und implementiert nun im dreijährigen Projekt jbDATA (just better DATA) einen Smart Data Loop, damit relevante Daten effizient gesammelt, in der Edge passend aufbereitet und industriell genutzt werden können. Die Daten werden bei der Aufzeichnung im Fahrzeug gefiltert und vorsortiert, qualifiziert, vorverarbeitet und annotiert, Datenlücken und Edge Cases identifiziert und mit synthetischen Daten angereichert. Neu ist, dass jbDATA die Datenbewertung in die Edge verortet, also in das aufnehmende Fahrzeug. Im Rahmen von vier Teilprojekten (TP) wird das spezifizierte Datenset von den neun Projektpartnern umgesetzt.
Mit Versuchsfahrzeugen im Projekt wird exemplarisch ein Datensatz eingefahren, der die Ausgangsbasis für ein vollumfängliches, industriell nutzbares Datenset bilden soll. Darüber hinaus plant jbDATA den im Projekt erhobenen Datensatz für eine breite Nutzung in der Forschung auch jenseits des Konsortiums zugänglich zu machen. (oe)