RUB » FBI » MAS » Forschung

 

Forschungsgebiete

 


Intelligent Control – Reinforcement Learning

The application of Artificial Intelligence (AI) and Reinforcement Learning (RL) techniques has recorded a tremendous interest in recent years. The idea of learning and optimizing from experience could be effectively used and verified in control strategies in simulation. Yet the execution of these techniques directly in real-life applications can be challenging due to the presence of uncertainties and disturbances. Our aim is to develop and implement concepts from AI and RL to design effective control strategies and test them in actual systems in our lab. The inverted pendulum (IP) system is one of the most popular benchmark devices to test new control algorithms. An RL-based control strategy coupled with a PID controller is tested to swing up and balance the linear IP in our lab. The RL Agent is trained in simulation before applying it to the real experimental system. Current work involves online training of the Agent using different algorithms.

        

Description of the figures
Left: Experimental set-up with the inverted pendulum
Right:
Schematic of the control strategy where the Agent is trained in simulation and then deployed in the real system along with a PID controller to stabilize the balance.

Anfang

 

Aktive Schwingungsminderung

Aktive Schwingungsminderung (Active Vibration Control AVC) ist ein relativ ausgereiftes Forschungsgebiet, das kontinuirlich mechanische und im Bauwesen befindliche Systeme auf  Einwirkungen von ungewünschten Schwingungen aus der Umgebung untersucht. Eine Herausforderung in diesem Forschungsfeld ist die Verknüpfung von Modellierungsmethoden für diese Systeme (wie z.B. FE bsierte ordnungsreduzierte Modelle, oder noch wichtiger für echtzeit Anwendungen, Systemidentifikations-methoden) mit aktiven und semi-aktiven Regelungssystemen. Unsere Forschung auf dem Gebiet richtet sich unter anderem auf die Untersuchung des nichtlinearen Verhaltens der Strukturen mit dem Ziel der Qualifizierung von Unsicherheiten. Auf diese Weise können aus der Systemidentifikation im Zeit- und/oder Frequenzbereich enthaltene lineare Modelle verbessert werden. Als Ergebnis können weniger konservative modellbasierte Regelungsmethoden entforfen werden, die AVC Probleme auf eine effiziente Weise lösen.

 Anfang

 

Robuste adaptive Regelung – Gleitregimeregelung

Gleitregimeregelung (auch Gleitmodusregelung oder Sliding-Mode-Regelung) wird dank ihrer Robustheit gegenüber Unsicherheiten und externen Störungen oft für die Regelung der linearen oder nichtlinearen Systeme mit Modellierungsunsicherheiten verwendet. Jedoch zeichnet sich diese Regelungsmethode auch durch einige Nachteile wie zum Beispiel: das sogenannte Chattering Problem (Rattern); anspruchsvolle Verfahren für die Ermittlung der oberen Grenze der unbekannten Störung oder Unsicherheit, sowie eine langsame Konvergenz. Um diese Nachteile zu bewältigen, schlagen wir eine neuartige Gleitregimeregelung vor, in welcher wir die Gleitebene und die Erreichbarkeit des Gleitregimes verbessern, sowie indem wir die Gleitregimeregelung mit anderen Regelungen hybridisieren wie z.B. mit Backstepping-Reglern, Neuronale-Netzwerk-Reglern, PID Reglern. Damit verbessern wir die Performanz und lindern das Rattern.
Robotische Manipulatoren spielen eine wichtige Rolle in mehreren industriellen Zweigen und dienen als interessanter Benchmark in der Entwicklung und Bewertung von neuen nichtlinearen Regelungen. Der Hauptzweck der Robotersteuerung ist, den Trajektorie-Fehler des robotischen Manipulators zu reduzieren. Allerdings degradieren die Komplexität der Dynamik, Nichtlinearitäten, Modellierungsunsicherheiten, und Störungen die Tracking-Performance der Roboter. Deshalb wird für die Implementierung unserer neuartigen Gleitregimeregelung auch ein robotischer Manipulator als Benchmark für die Evaluierung und Validierung der Effektivität der Regelung verwendet.