Ein von Forschern jetzt vorgestellter Ansatz bietet eine intelligentere und effizientere Möglichkeit zur Verwaltung komplexer Systeme, wie autonomen Fahrzeugsystemen, Verkehrs- und Energienetze, bei denen Entscheidungen von den Akteuren nicht gleichzeitig oder gleichberechtigt getroffen werden.
„Diese Art von Systemen funktioniert nach einer Macht-Hierarchie, bei der ein Akteur den ersten Schritt macht und die anderen folgen müssen. Sie sind komplizierter, als typische KI-Modelle annehmen“, sagt Zhen Ni, Ph.D., leitender Autor, IEEE-Senior-Mitglied und außerordentlicher Professor an der Florida Atlantic University (FAU). „Traditionelle KI-Methoden behandeln oft alle Entscheidungsträger als gleichberechtigt, die gleichzeitig mit dem gleichen Einfluss agieren. Das sorgt zwar für saubere Simulationen, spiegelt aber nicht wider, wie Entscheidungen in realen Szenarien tatsächlich getroffen werden – insbesondere in Umgebungen, die von Unsicherheit, begrenzter Bandbreite und ungleichmäßigem Zugang zu Informationen geprägt sind.“
Um dieses Problem anzugehen, entwickelten Ni und Xiangnan Zhong, Ph.D., Erstautor, IEEE-Mitglied und außerordentlicher Professor der FAU, ein neues KI-Framework auf der Grundlage des verstärkenden Lernens.
Ihr Ansatz umfasst zwei wesentliche Neuerungen. Erstens strukturiert er den Entscheidungsprozess mithilfe eines spieltheoretischen Modells namens Stackelberg-Nash-Spiel, bei dem ein „führender“ Akteur zuerst handelt und „folgende“ Akteure optimal darauf reagieren. Zweitens haben die Forscher einen ereignisgesteuerten Mechanismus eingeführt, der den Rechenaufwand reduziert.
„Anstatt Entscheidungen wie bei vielen KI-Systemen üblich bei jedem Zeitschritt ständig zu aktualisieren, aktualisiert unsere Methode Entscheidungen nur bei Bedarf, wodurch Energie und Rechenleistung gespart werden, während Leistung und Stabilität erhalten bleiben“, so Zhong.
Das Ergebnis ist ein System, das nicht nur die Machtasymmetrie zwischen Entscheidungsträgern bewältigt, sondern auch mit ungleichen Unsicherheiten umgeht – also Fällen, in denen verschiedene Akteure mit unterschiedlichen Informations- und Vorhersagbarkeitsgraden arbeiten. Dies ist besonders wichtig in Umgebungen wie intelligenten Stromnetzen oder Verkehrsleitsystemen, in denen sich die Bedingungen schnell ändern und die Ressourcen oft begrenzt sind. Der Rahmen ermöglicht eine robustere, anpassungsfähigere und skalierbarere Form der KI-Steuerung, die begrenzte Bandbreiten und Rechenressourcen besser nutzen kann.
Gestützt auf strenge theoretische Analysen und validiert durch Simulationsstudien haben Zhong und Ni gezeigt, dass ihre ereignisgesteuerte Methode des verstärkenden Lernens die Systemstabilität aufrechterhält, optimale Strategieresultate gewährleistet und unnötige Berechnungen effektiv reduziert. Der Ansatz kombiniert tiefe Kontrolltheorie mit praktischem maschinellem Lernen und bietet einen überzeugenden Weg für intelligente Steuerung in asymmetrischen, unsicheren Umgebungen.
Das Forschungsteam arbeitet derzeit daran, sein Modell für groß angelegte Tests in realen Szenarien zu erweitern. Langfristig soll dieses KI-Framework in operative Systeme integriert werden, die Städte versorgen, den Verkehr steuern und Flotten autonomer Maschinen koordinieren – damit rückt die Vision einer intelligenteren Infrastruktur einen Schritt näher an die Realität. (jr)
