News Ticker

[ 2. April 2026 ] Melexis: Dreiphasiger Lüftertreiber für schnelle Designimplementierung News
[ 1. April 2026 ] Applied Intuition: Einheitliche Softwareplattform für Traton-Fahrzeuge News
[ 1. April 2026 ] Würth Elektronik: Speicherinduktivität für hohe Schaltfrequenzen News
[ 1. April 2026 ] Rohm: Hochleistungs-Operationsverstärker News
[ 31. März 2026 ] Rohm: Gespräche mit Mitsubishi und Toshiba zur Zusammenführung des Leistungselektronikgeschäfts Branchen-News
[ 31. März 2026 ] BMW: Start der Erhebung von Bilddaten aus Kundenfahrzeugen Branchen-News
[ 31. März 2026 ] Tier IV: Open-Source-Software-Stack für Level 4 News
[ 31. März 2026 ] Open House Germany 2026: Branchentreff für neue Teststrategien Branchen-News
[ 31. März 2026 ] Neuer Entwicklungsleiter bei Mercedes-Benz Trucks Branchen-News
[ 30. März 2026 ] Zoox: Ausweitung der Robotaxi-Fahrdienste und Testbetriebe Branchen-News

LLMs wie ChatGPT versagen selbst bei einfachen Logikaufgaben

14. August 2024 Technologie-Radar

ChatGPT-Screenshot — ChatGPT 4's response to a logic question posed on 8/14/2014 proves inadequacy of LLMs.

Selbst die besten KI-Sprachmodelle versagen bei logischen Fragestellungen dramatisch. Zu dieser Erkenntnis gelangen Forschende des Jülich Supercomputing Centre (JSC), der School of Electrical and Electronic Engineering der Universität Bristol und dem KI-Labor LAION. In ihrem Paper, „Alice in Wonderland: Simple Tasks Showing Complete Reasoning Breakdown in State-Of-the-Art Large Language Models“, attestieren die Forschenden den getesteten topmodernen LLM einen „starken Zusammenbruch der Funktions- und Denkfähigkeit“ und vermuten, dass Sprachmodelle zwar die grundlegende Fähigkeit haben, Schlussfolgerungen zu ziehen, diese aber nicht zuverlässig abrufen können. Sie fordern die wissenschaftliche und technologisch Gemeinschaft dazu auf, eine dringende Neubewertung der behaupteten Fähigkeiten der aktuellen Generation von LLM anzuregen. Darüber hinaus verlangen sie die Entwicklung standardisierter Benchmarks, um Schwächen von Sprachmodellen bezüglich ihrer Argumentationsfähigkeit aufzudecken – denn gängige Tests haben diesen gravierenden Fehler bisher offenbar nicht erkannt. (jr)

Link zur Originalmeldung

Link zur Pre-View des Forschungspapers

AEEmobility

Der Information Hub für Automobilelektronikentwickler

LLMs wie ChatGPT versagen selbst bei einfachen Logikaufgaben

Ähnliche Artikel

Europäischer Exascale-Supercomputer JUPITER setzt neue Maßstäbe für Energieeffizienz

Alibaba Cloud: LLM mit Nvidia-Hardwarebeschleunigung

Erster elektrisch gepumpter, kontinuierlicher Laser für die nahtlose Integration in Si-Chips