所有語言
分享
原文來源:學術頭條
圖片來源:由無界 AI生成
我們能否在歷史的十字路口避免戰爭?在人類歷史上,個人、學者、決策者和組織一直在追問這個問題。
如今,AI Agent 試圖模擬人類複雜行為,還原歷史大戰場景,來回答這一問題。
日前,由美國羅格斯大學和密西根大學研究團隊提出的 AI Agent——WarAgent 便成功模擬了包括第一次世界大戰、第二次世界大戰和中國古代戰國時期戰爭在內的歷史重大國際衝突。
據論文描述,WarAgent 證明了其作為了解國際衝突動態的工具的可靠性,充分展示了基於大型語言模型 (LLMs)的多智能體 AI 系統在原型設計和分析複雜人類行為方面的優越能力。實驗證明,即使是最微小的觸發事件,也可能演變成類似於冷戰的局勢,突顯了戰爭的不可避免性。
相關研究論文以“War and Peace (WarAgent): Large LanguageModel-based Multi-Agent Simulation of World Wars”為題,已發表在預印本網站 arXiv 上。
研究結果提供了基於數據和 AI 增強的見解,有望重新定義人們對衝突解決和維和戰略的理解。這一發現不僅僅是歷史分析的延伸,更提供了一種通過 AI 理解人類歷史、預防未來國際衝突的藍圖。
智能體的獨特機制
大型語言模型(LLMs)能夠模擬虛擬的城市街景、探險遊戲中的角色互動,以及智能解決複雜的任務。
然而,這項技術的發展並未止步於此,最新的智能體系統 WarAgent 不僅在模擬複雜行為方面取得了巨大進展,而且成功還原了歷史大戰的場景。
WarAgent 建立在四個基礎構件之上:Country agents、Secretary agents、Board 和 Stick。
Country agents 代表各個國家,每個國家都擁有獨特的國家概況。它們通過在預定的行動範圍內生成行動來應對各種情況,這些行動受到結構化提示的指導。這些提示有助於智能體在複雜的國際關係中根據聯盟、敵對關係和戰略考慮做出決策。
Secretary agents 負責促進 Country agents 與系統之間的互動,它們在管理 Country agents之間的信息和提案流動方面發揮着關鍵作用。
Board 充當一個動態平台,記錄和展示每個模擬回合中正在進行的關係動態。它負責追蹤國際關係,其中包括戰爭宣言和軍事聯盟,確保代理的決策基於最新的信息。
Stick 充當每個國家內部記錄系統的角色,代表了該國的國內法規。它有助於確保該國智能體的行動符合預先定義的協議和標準。
圖|Board 和 Stick 設計(來源:該論文)
據論文描述,WarAgent 系統的核心在於其獨特的 Agent-Secretary interaction 和 Agent-Agent interaction 機制。在這個系統中,每個國家都由一個 AI 智能體表示,這些智能體根據歷史資料和當前的國際關係生成行動和決策。
Secretary agents 在此過程中起到了橋樑的作用,它們調整 Country agents 的提案,確保行動的連貫性和可行性。與此同時, Country agents 之間的直接互動則完全基於歷史事件的觸發,這些互動展現了國際關係的複雜性和動態變化。
圖|Agent interaction 設計 (a) WarAgent 架構 (b) Agent-Secretary interaction (c)
Agent-Agent interaction (來源:該論文)
此外,WarAgent 的模擬框架採用回合制設計,每個回合中,Country agents 根據結構化的環境進行決策和行動。這種設計不僅使模擬更加真實,還為研究者提供了一個獨特的視角,從而探索歷史事件的多種可能性。
研究團隊通過一系列的研究問題和實驗來測試 WarAgent 的有效性。這些實驗不僅驗證了模擬系統的可靠性,還揭示了即使是微小的觸發事件也可能導致類似冷戰的局勢,強調了在特定情況下戰爭的不可避免性。
意義遠遠超越 WarAgent 系統本身
WarAgent 標志著將基於大型語言模型的多智能體系統應用於模擬和研究複雜的人類社會行為的研究的開端,尤其是在歷史和國際關係的環境中。這一進展為歷史模擬的潛在應用提供了啟示,遠遠超越了 WarAgent 系統本身。
對計算機和信息科學家來說,研究結果展示了 LLMs 在模擬複雜歷史衝突和做出明智決策方面的推理能力。這強調了 AI 對人類和社會的深刻影響,為理解和潛在避免未來衝突提供了工具,從而有助於全球和平與穩定。
對歷史學家而言,該研究為理解歷史事件提供了新工具,鼓勵重新評估對戰爭和衝突原因的理解。
對政策制定者和國際關係專家來說,模擬中獲得的見解為國家或國際衝突的預防和解決提供了新的策略,這有助於制定更有效和更明智的政策。
對於學習歷史的學生,這些模擬提供了學習歷史的創新方法,使學生和教育者能夠探索“假設”場景,並理解歷史事件中錯綜複雜的因果關係網。這種方式可以促進學生與學科更深入的接觸,增強其批判性思維。
此外,通過展示基於 LLMs 的模擬在理解複雜國際動態方面的實用性,該研究為未來跨學科領域的研究,如計算歷史和数字人文學,樹立了先例。
局限與展望
然而,必須注意到,該研究也存在一定的局限性,在通信技術差異、間諜活動、消息公開程度 以及軍隊動員差異方面考慮欠妥。
通信技術的差異是外交關係中一個顯著的方面,這會導致消息傳遞的時間延遲。從歷史上看,派遣大使是一個時間密集型的過程,其持續時間根據距離的不同而顯著變化。因為消息傳遞的時機可能影響外交交流的結果,所以該因素在塑造外交關係方面發揮了重要的作用。
此外,間諜活動增加了事件複雜性。在歷史背景下,間諜經常攔截和解密消息,從而影響了各國之間信息流動和完整性。
另一個關鍵因素是消息公開程度的不同。與該模型中私人和公共消息的二元區別不同,歷史上的外交通信存在於一個受各種戰略和情境因素影響的範圍內。
最後,軍隊的動員在各國之間差異巨大。這種差異可能會對戰爭宣告的時機和可行性產生關鍵影響,從而顯著影響國際衝突和關係的發展。
值得注意的是,基於目前存在的缺點,研究還提出了幾個未來值得探索的方向。
當前的模擬缺乏系統性的結束標準,研究提出採用“板塊連接性”等方法,建立更有序的模擬結束條件,其可能的標準包括形成連接圖並在一定回合內保持不變,或者實現特定歷史結果或經濟、軍事平衡。
除了核心調查外,研究提出一系列新的研究問題,包括外交溝通與衝突可能性的相關性、非國家行為者對地緣政治的影響以及國際條約和協議在解決長期爭端中的有效性。
通過採用基於 LLMs 的多智能體進行定量分析,有望提供更全面的工具,深入了解塑造歷史事件的複雜因素和過程。這些改進和新的研究問題將有助於進一步提高 WarAgent 系統的模擬精度和研究深度。
論文鏈接: