kramann.info
© Guido Kramann

Login: Passwort:










kramann.info
© Guido Kramann

Login: Passwort:




Architekturen zur Entwicklung autonomer mobiler Systeme (und ein wenig Geschichte)

(EN google-translate)

(PL google-translate)

Die Entwicklung autonomer mobiler Systeme ist ein sehr komplexes Thema. Anders als bei der Behandlung besonderer Teiltechniken, wie beispielsweise Mikrocontrollertechnik, Objekt Orientierte Programmierung, oder Dynamik technischer Systeme, geht es nicht so sehr um Einzelwissen, sondern um die Organisation eines Gesamtsystems.

Eine Architektur bildet nicht nur die Organisation einzelner Komponenten des Gesamtsystems innerhalb einer hierarchischen Ordnung wider, sondern stellt gleichzeitig eine bestimmte grundlegende Sichtweise auf das Gesamtsystem dar.

Diese Tatsache soll anhand einiger konkreter Beispiele für mögliche grundsätzliche Architekturen verdeutlicht werden:

Verhaltens basierte Architekturen

Beispiel für eine Verhaltens orientierte Architektur (Frei übertragen in Anlehnung an CEBOT Mark V, Quelle: Arkin, R.C., Behavior-Based Robotics, S.362, MIT Press London 1998.)

Bild 0-1: Beispiel für eine Verhaltens orientierte Architektur (Frei übertragen in Anlehnung an CEBOT Mark V, Quelle: Arkin, R.C., Behavior-Based Robotics, S.362, MIT Press London 1998.)

Hervorgehoben sind in einer Verhaltens basierte Architektur mögliche Verhaltensweisen, deren Aktivierungsregeln und deren Zusammenspiel.

Es handelt sich um eine Architektur, bei der die Software des AV im Vordergrund steht.

Das erwähnte Beispiel wurde 1995 in Japan durch Fukuda und anderen entwickelt und stellt ein frühes Konzept für Zelluläre- / Kooperative- / Schwarm-Robotik dar (cellular robotic / CEBOT).

Wie das Zusammenspiel mehrerer Regeln sich auf das Gesamtverhalten auswirkt und wie sich dann mehrere AV / Roboter dieser Art im Zusammenspiel verhalten, läßt sich ab einer gewissen Komplexität nicht mehr rein theoretisch ermitteln. Hier hilft nur ein Versuch und heutzutage Simulationsumgebungen (über die dann auch Regeln optimiert werden können).

In dem Beispiel wurden aus den Verhaltensregeln Richtungsvektoren generiert und das resultierende tatsächliche Verhalten einfach als Vektorsumme realisiert.

Dieses Vorgehen wirft natürlich gleich die Frage danach auf, ob es gerechtfertigt ist und ob es hier bessere Auswahlkonzepte gibt.

Ein Beispiel für einen erweiterten Ansatz, um Verhaltensalternativen zu gewichten stellt beispielsweise der "Hormon-gesteuerte" automatische Staubsauger "Sozzy" dar (Yamamoto 1993, Quelle: Arkin, R.C., Behavior-Based Robotics, S.436, MIT Press London 1998.).

Die Gewichtung der Verhaltensmöglichkeiten erfolgt hier nicht mehr unmittelbar auf der Grundlage des Sensor-Inputs, sondern darüber hinaus aufgrund innerer Zustände, die metaphorisch als "Emotionale Zustände" interpretiert werden können.

Je nach bestimmten emotionalen Zuständen wird die eine oder andere Verhaltensweise unterdrückt.

Der emotionale Zustand wiederum hängt ab von Parametern wie Batterie-Level, aktuelle Dauer der Arbeit, oder der Verlust des Kontakts zu einer Orientierungs-Bake.

Diese Erweiterung des Verhaltenskonzeptes hat laut Yamamoto bei den Benutzern den subjektiven Eindruck größerer Lebendigkeit und von Freundlichkeit hervorgerufen.

Beispiel für eine Verhaltens orientierte Architektur (Frei übertragen in Anlehnung an

Bild 0-2: Beispiel für eine Verhaltens orientierte Architektur (Frei übertragen in Anlehnung an "Sozzy", Quelle: Arkin, R.C., Behavior-Based Robotics, S.437, MIT Press London 1998.)

Systeme, die ein bestimmtes Verhalten an den Tag legen, um selbsttätig bestimmte Aufgaben zu erledigen, werden auch Agentensysteme bezeichnet.

Dabei gibt es in der Komplexität aufsteigend...

  • REFLEX-AGENTEN, d.h. ganz einfache reaktive Agenten,
  • REGELBASIERTE AGENTEN-SYSTEME, solche mit inneren Zuständen,
  • MODELLBASIERTE AGENTEN-SYSTEME, solche, die außerdem ein Modell ihrer Umwelt besitzen,
  • LERNENDE MODELLBASIERTE AGENTEN-SYSTEME, solche, die den Erfolg ihres Verhaltens eigenständig überwachen und bewerten, um daraus zu lernen.
REFLEX-AGENT

Bild 0-3: REFLEX-AGENT

REGELBASIERTES AGENTEN-SYSTEM

Bild 0-4: REGELBASIERTES AGENTEN-SYSTEM

MODELLBASIERTES AGENTEN-SYSTEM

Bild 0-5: MODELLBASIERTES AGENTEN-SYSTEM

LERNENDES MODELLBASIERTES AGENTEN-SYSTEM

Bild 0-6: LERNENDES MODELLBASIERTES AGENTEN-SYSTEM

Einer der ersten Umsetzungen eines Reflex-Agenten stellt die "CORA the tortoise" (Schildkröte) von Grey Walter dar. Internetquelle aufgerufen am 23.02.2016:

Historische Darstellung der verschiedenen Roboter von Grey Walter.
Historische Darstellung zu "CORA the tortoise".
Suchbewegung von CORA, um eine Behausung zu finden, Quelle wie oben.

Bild 0-7: Suchbewegung von CORA, um eine Behausung zu finden, Quelle wie oben.

tortoise.zip - ogv-Video zu Grey Walters CORA.

Einige grundsätzliche Szenarien für reine Reflex-Agenten wurden von Valtentin Braitenberg 80er Jahren untersucht. Hier ging es vor allem darum zu zeigen, wie aus relativ primitiven inneren reglungstechnischen Sensor-Aktuator-Strukturen durch Interaktion mit der Umwelt sich häufig ein recht komplexes Verhalten einstellt.

Hier ein Beispiel dieser grundsätzlichen Prinzipien (Quelle: Braitenberg, V., Künstliche Wesen - Verhalten kybernetischer Vehikel, S.11, Vieweg Braunschweig 1986):

Furcht und Aggression: Wesen a) und b) befinden sich in der Nähe einer Reizquelle. Wesen b) richtet sich zur

Bild 0-8: Furcht und Aggression: Wesen a) und b) befinden sich in der Nähe einer Reizquelle. Wesen b) richtet sich zur

Hierarchische Architekturen im Vergleich zu sich auf einer Ebene abstimmenden Konzepten

NASREM
NASREM (freie Übertragung ins Deutsche gemäß diverser Internet-Quellen).

Bild 0-9: NASREM (freie Übertragung ins Deutsche gemäß diverser Internet-Quellen).

Als vielleicht bekannteste und wahrscheinlich auch am extremsten hierarchisch organisierte Architektur gilt NASREM (NASA Standard Reference Model) von James Albus (1987), Quelle: Bekey, G.A., Autonomous Robots, S.103ff., MIT Press 2005 Cambridge.

Vertikal ist sie untergliedert in 6 Ebenen. Die unterste ist die niedrigste / primitivste, die oberste die abstrakteste. Unten geht es um die Verarbeitung von Sensordaten und die Steuerung von Aktuatoren, ganz oben u.a. um die Handhabung einer Mission.

Die mittleren drei Säulen, also die horizontalen Unterteilungen, repräsentieren - vielleicht etwas zu anthropomorphisierend übersetzt: Fühlen, Denken, Wollen.

Die erste der drei mittleren Säulen repräsentiert, was sich aus der Verarbeitung der Sensordaten ergibt z.B. von den reinen Bilddaten (unten) über extrahierte Merkmale (Mitte), bis hin zu extrahierten und identifizierten Merkmalen (ganz oben).

Die zweite (mittlere) der drei mittleren Säulen repräsentiert das Wissen über die Umwelt. Auf der obersten Ebene handelt es sich um ein Weltmodell - also eine umfassende Repräsentation von dem, was das AV oder der Roboter als seine Umwelt erkannt hat.

Schließlich repräsentiert die dritte der drei mittleren Säulen die Planung, Ausführung und Bewertung des zu erledigenden Auftrags bzw. der ständig auszuführenden Aufgabe. Weiter unten könnte das die aktuelle Spurregelung sein, eine Ebene höher könnte es um die Aktualisierung der Soll-Fahrtrajektorie gehen und ganz oben geht es um die abstrakte Repräsentation der zu erledigenden Aufgabe, also beispielsweise bringe C von A nach B.

Flankiert sind die mittleren Säulen links durch Daten und Programme, bei denen es sich z.B. um Landkarten, Modellparameter, Objektlisten, Berechnungsfunktionen u.ä. handeln kann. Von rechts sind die mittleren Säulen durch eine "Benutzer-Schnittstelle" flankiert. Über diese Schnittstelle kann ein benutzer für die verschiedenen Ebenen Rahmenbedingungen festlegen.

Überlegung des Dozenten: Die Idee der Objekt Orientierten Programmierung kam zeitgleich mit diesem Konzept auf. Wären den Erfindern von NASREM diese bereits geläufig gewesen und deren Paradigma zusammengehörige Daten und Methoden gemeinsam in einem Objekt zu repräsentieren, so würden die flankiereden Säulen "Globaler Speicher" und "Benutzer-Schnittstelle" womöglich jeweils in den Objekten der mittleren Säulen untergebracht sein.

ZEIT-Ebenen: Die Ebenen (horizontale Untergliederung) bei NASREM repräsentieren auch Prozesse mit sehr unterschiedlichem Zeithorizont. Die schnellsten Prozesse befinden sich auf der untersten, die langsamsten auf der obersten Ebene. Das ist ein wichtiger bei der Implementierung zu berücksichtigender Aspekt.

Trajektorien-Planung und Verfolgung bei Raketen, als Regelkreis mit Blockdiagramm

Zu der Zeit, als NASREM entworfen wurde, war James Albus mit der Entwicklung der Lenkregelung einer ballistischen Rakete betraut.

Hier gibt es nur zwei horizontale Ebenen: Eine, die Schwingungen des Systems abdämpft und eine zweite langsamere, die damit betraut ist, die aktuell gültige Flugbahn (Trajektorie) durch Regelung einzuhalten.

Albus' Regelungskonzept als Kaskadenregler interpretiert.

Bild 0-10: Albus' Regelungskonzept als Kaskadenregler interpretiert.

Man kann sich als weiter übergeordnete Ebene eine vorstellen, bei der auch die Solltrajektorie immer wieder neu berechnet wird. Dies kann nötig sein aufgrund eines Wegdriftens der Rakete von der ursprünglich geplanten Trajetorie aufgrund von Störungen (Wind). #pdf nasrem.pdf NASREM.pdf - NASREM-Beschreibung vom "National Institute of Standards and Technology" (NIST, USA) unter: http://www.nist.gov/el/isd/upload/NASREM.pdf