如何確保由神經網絡控制的機器人的穩定性?
發布時間:2024-08-02 作者:Alex Shipps
神經網絡控制器為復雜機器人提供了穩定性保障,為自動駕駛汽車和工業機器的更安全部署鋪平了道路。麻省理工學院的研究人員開發了一種高效的算法來認證復雜系統中的Lyapunov函數,確保神經網絡控制的機器人在各種環境中實現穩定性和安全性。
神經網絡對工程師如何設計機器人控制器產生了巨大的影響,催生了自適應能力更強、效率更高的機器。不過,這些類似大腦的機器學習系統也是一把雙刃劍:其復雜性使其功能強大,但也難以保證由神經網絡驅動的機器人能夠安全地完成任務。
驗證安全性和穩定性的傳統方法是通過稱為 Lyapunov 函數的技術。如果你能找到一個 Lyapunov 函數的值持續下降,那么你就可以知道,與較高值相關的不安全或不穩定情況將永遠不會發生。不過,對于由神經網絡控制的機器人來說,之前驗證 Lyapunov 條件的方法并不能很好地擴展到復雜的機器。
麻省理工學院計算機科學與人工智能實驗室(CSAIL)和其他機構的研究人員現在已經開發出新的技術,可以在更復雜的系統中嚴格認證Lyapunov計算。該算法高效搜索并驗證了Lyapunov函數,為系統提供了穩定性保障。這種方法有可能使機器人和自動駕駛車輛(包括飛機和航天器)的部署更加安全。
圖:研究人員設計了一種新算法,可以保證由神經網絡控制的機器人的穩定性,
最終可能帶來更安全的自動駕駛汽車和工業機器人。
為了超越以往的算法,研究人員在訓練和驗證過程中找到了一條省錢的捷徑。他們生成了成本更低的反例——例如,來自傳感器的對抗性數據可能會使控制器失靈——然后對機器人系統進行優化,以應對這些反例。了解這些邊緣案例有助于機器學習如何處理具有挑戰性的情況,從而使它們能夠在比以往更廣泛的條件下安全運行。然后,他們開發了一種新穎的驗證公式,能夠使用可擴展的神經網絡驗證器α,β-CROWN,在反例之外提供嚴格的最壞情況保證。
“我們已經在人形機器人和機器狗等AI控制的機器上看到了一些令人印象深刻的經驗性能,但這些AI控制器缺乏對安全關鍵型系統至關重要的形式保證。”麻省理工學院電氣工程與計算機科學(EECS)博士生、CSAIL 附屬研究員Lujie Yang說:“我們的工作縮小了神經網絡控制器的性能水平與在現實世界中部署更復雜的神經網絡控制器所需的安全保證之間的差距。”
在數字演示中,該團隊模擬了帶有激光雷達傳感器的四旋翼無人機如何在二維環境中保持穩定。他們的算法成功地將無人機引導到穩定的懸停位置,僅使用激光雷達傳感器提供的有限環境信息。
在另外兩個實驗中,他們的方法使兩個模擬機器人系統能夠在更廣泛的條件下穩定運行:倒立擺和路徑跟蹤車輛。這些實驗雖然規模不大,但比以前的神經網絡驗證可能做的要復雜得多,特別是因為它們包含傳感器模型。
“與常見的機器學習問題不同,嚴格使用神經網絡作為Lyapunov函數需要解決困難的全局優化問題,因此可擴展性是關鍵瓶頸,”加州大學圣地亞哥分校計算機科學與工程副教授Sicun Gao說, “目前的工作通過開發算法方法做出了重要貢獻,這些算法方法更適合神經網絡的特定使用,因為Lyapunov在控制問題中的作用。”
與現有方法相比,它在可擴展性和解決方案質量方面取得了顯著的改進。這項工作為進一步開發神經Lyapunov方法的優化算法,以及深度學習在控制和機器人技術中的嚴格使用開辟了令人興奮的方向。
新的穩定性方法具有潛在的廣泛應用。在這些應用中,保證安全至關重要。它可以幫助確保飛機和航天器等自動駕駛汽車的行駛更順暢。同樣,運送物品或繪制不同地形的無人機也可以從這種安全保證中受益。
新方法不僅限于機器人技術,在未來可能會幫助其他應用,如生物醫學和工業加工等。雖然該技術在可擴展性方面比以前的工作有所提升,但研究人員正在探索它如何在具有更高維度的系統中表現得更好。他們還希望考慮激光雷達讀數以外的數據,例如圖像和點云。
作為未來的研究方向,該團隊希望為處于不確定環境和易受干擾的系統提供相同的穩定性保證。例如,如果一架無人機面臨一陣強風,研究人員希望確保它仍然能穩定飛行并完成預期的任務。
此外,他們打算將他們的方法應用于優化問題,其目標是在保持穩定的同時最小化機器人完成任務所需的時間和距離。并計劃將他們的技術擴展到類人機器人和其他現實世界的機器,在這些機器中,機器人需要在與周圍環境接觸時保持穩定。