Forschende der University of California haben festgestellt, dass die gängigen Metriken zur Bewertung des kompositorischen Schließens von multimodalen KI-Modellen deren Fähigkeiten systematisch unterschätzen. In ihrer Veröffentlichung „Test-Time Matching: Unlocking Compositional Reasoning in Multimodal Models“ berichten sie über ihre Ergebnisse und stellen einen von ihnen entwickelten Algorithmus namens TTM (Test-Time Matching) vor. Test-Time Matching ist ein sich selbst verbessernder, iterativer Algorithmus, der die Modellleistung ohne externe Überwachung steigert. Mit TTM übersteigt die MMVP-VLM-Performance von SigLIP-B16 die von GPT-4.1 und stellt somit einen neuen „Stand der Technik“ dar. Experimente mit 16 Datensatzvarianten haben dabei gezeigt, dass TTM die Leistung in verschiedenen Umgebungen konsistent verbessert – auch in solchen ohne metrikbedingte Effekte oder vordefinierte Gruppenstrukturen. (jr)
Ähnliche Artikel
News
Nvidia: Open-Source-KI-Modelle für autonomes Fahren der Stufe 4
8. Januar 2026
Klaus Oertel
News, Produkt-News
Kommentare deaktiviert für Nvidia: Open-Source-KI-Modelle für autonomes Fahren der Stufe 4
Das neue physische KI-Modell Alpamayo soll Robotaxis befähigen, seltene und komplexe Verkehrssituationen sicherer zu bewältigen und Fahrentscheidungen nachvollziehbar zu erklären.
News
MathWorks: Release 2024b von MATLAB und Simulink
12. September 2024
Franz Joachim Rossmann
News, Produkt-Highlight, Produkt-News
Kommentare deaktiviert für MathWorks: Release 2024b von MATLAB und Simulink
Das Release 2024b von MathWorks enthält zahlreiche neue und verbesserte Funktionen der MATLAB- und Simulink- Produktfamilien, darunter wichtige Updates, die eine optimierte, schnellere Entwicklung von Signalverarbeitungsanwendungen ermöglichen
News
Renesas: kostenlose Sandbox-Evaluierungsumgebung für KI/ML-Entwicklung
16. Juli 2024
Franz Joachim Rossmann
News, Produkt-News
Kommentare deaktiviert für Renesas: kostenlose Sandbox-Evaluierungsumgebung für KI/ML-Entwicklung
Angebot umfasst die Module für die automatisierte Erstellung von KI-Modellen, die Validierung und den Einsatz der Reality AI Tools zusammen mit Tutorials, Anwendungsbeispielen und E-Mail-Support.
