- 相關推薦
基于增強學習的無人直升機姿態控制器設計
自適應啟發評價(AHC)增強學習結構分別逼近馬爾可夫決策過程的值函數和策略函數,策略梯度增強學習能夠將隨機不確定的馬爾可夫決策過程轉換為確定性的馬爾可夫決策過程.通過將AHC增強學習和策略梯度增強學習相結合,對PID控制器參數進行在線自適應整定,實現對無人直升機姿態控制性能的在線優化.仿真結果表明,與固定PID參數控制器相比,該算法能在線調整控制器參數,并很好地控制了無人直升機的懸停姿態.
王俊生,稅海濤,馬宏緒,黃茜薇,WANG Junsheng,SHUI Haitao,MA Hongxu,HUANG Qianwei(國防科學技術大學機電工程與自動化學院,長沙,410073)
刊 名: 彈箭與制導學報 PKU 英文刊名: JOURNAL OF PROJECTILES, ROCKETS, MISSILES AND GUIDANCE 年,卷(期): 2008 28(2) 分類號: V249.1 TP273 關鍵詞: 無人直升機 增強學習 自適應啟發評價 策略梯度 PEGASUS【基于增強學習的無人直升機姿態控制器設計】相關文章:
基于遺傳算法的直升機魯棒飛行控制器設計04-28
無人直升機模型體系設計04-27
基于TMS320F2810的小型無人機控制器的設計04-27
基于OpenGL的無人機三維姿態顯示04-27
自組織增強學習模糊神經網控制器的設計04-29
考慮控制飽和的衛星姿態控制器設計04-26
基于LQR的小衛星磁姿態控制設計04-27
小型無人直升機傳動系統設計技術研究04-26