Forschende der University of California haben festgestellt, dass die gängigen Metriken zur Bewertung des kompositorischen Schließens von multimodalen KI-Modellen deren Fähigkeiten systematisch unterschätzen. In ihrer Veröffentlichung „Test-Time Matching: Unlocking Compositional Reasoning in Multimodal Models“ berichten sie über ihre Ergebnisse und stellen einen von ihnen entwickelten Algorithmus namens TTM (Test-Time Matching) vor. Test-Time Matching ist ein sich selbst verbessernder, iterativer Algorithmus, der die Modellleistung ohne externe Überwachung steigert. Mit TTM übersteigt die MMVP-VLM-Performance von SigLIP-B16 die von GPT-4.1 und stellt somit einen neuen „Stand der Technik“ dar. Experimente mit 16 Datensatzvarianten haben dabei gezeigt, dass TTM die Leistung in verschiedenen Umgebungen konsistent verbessert – auch in solchen ohne metrikbedingte Effekte oder vordefinierte Gruppenstrukturen. (jr)
Ähnliche Artikel
Medienspiegel
Whitepaper: AIDV – die nächste Evolutionsstufe des Software-Defined Vehicle
Das Whitepaper zeigt, wie Qualcomm agentische KI architektonisch in das Software-Defined Vehicle integriert, bleibt jedoch bewusst auf konzeptioneller Ebene und liefert Entwicklern eher strategische Orientierung als konkrete Implementierungshilfen.
English Content
Cerence AI and SiMa.ai bring energy-efficient voice AI into the vehicle
5. September 2025
Klaus Oertel
English Content
Kommentare deaktiviert für Cerence AI and SiMa.ai bring energy-efficient voice AI into the vehicle
Cerence AI and SiMa.ai integrate the CaLLM Edge voice model into the Modalix MLSoC platform, enabling energy-efficient, low-latency conversational AI functions directly in the vehicle – regardless of cloud connection and network quality.
Fachberichte & White Paper
Fachartikel: Edge-KI mit NPUs und Modellkompression optimieren
Der Fachbeitrag von MathWorks zeigt, wie sich Edge-KI durch den Einsatz von NPUs und Modellkompression für Echtzeit- und Embedded-Anwendungen optimieren lässt, etwa in der Motorsteuerung mit Inferenzzeiten unter 10 ms.
