腦智卓越中心發表獼猴在吃豆人游戲中體現高級認知能力的研究成果

發布時間:2022-03-14

  2022314日,《eLife》在線發表了題為《獼猴在吃豆人游戲中的分層組合策略》的研究論文。該研究由中國科學院腦科學與智能技術卓越創新中心(神經科學研究所)、靈長類神經生物學國家重點實驗室楊天明研究組完成。該研究設計了一種新穎有趣的實驗范式——吃豆人游戲,并且訓練獼猴學會使用搖桿完成該游戲范式的主要任務。該研究將復雜的行為范式和人工智能建模結合,定量研究了獼猴解決復雜問題的啟發式行為策略特點,為理解大腦實現高級認知功能的計算機制提供了全新方法和重要啟發。 

  日常生活中,人們大部分的重要目標通常超出了簡單決策的實現范疇,然而,這些目標可以通過設計一系列縝密的基礎策略組合來實現。個體可以根據當前的情況優先考慮每一種策略的收益和風險,并在較容易完成的子任務中具體問題具體分析。高度動態變化的環境會時刻伴隨著出乎意料的意外和干擾,因此保持相機而變的靈活性也在決策過程中至關重要。盡管研究動物的復雜行為和潛在的神經機制在神經科學和認知科學領域是一個持續受到關注的科學問題,但大部分的動物行為范式復雜程度,都不足以支持研究動物如何簡化動態多樣的策略以完成復雜的高級認知任務。 

  為解決這些問題,該研究改編經典街機游戲吃豆人(圖A),并訓練獼猴學會使用操縱桿來控制吃豆人在一個封閉的迷宮中運動收集食物,獼猴避開敵人追擊將獲得實時果汁作為獎勵。在經過一段時間的訓練后,獼猴能夠理解游戲中各個元素和獎勵懲罰之前的關聯,并依次相應地做出連續的運動抉擇,來躲避敵人的追擊,獲取更多的獎勵,甚至在特定規則下對敵人實現反殺。雖然該游戲高度動態且元素復雜,但本質上它比較類似一個動物野外覓食任務,這也可能是該研究成功訓練動物的關鍵要素。 

  為定量地描述獼猴行為策略的特點,研究人員利用機器學習和統計方法,動態擬合匹配游戲玩法與多個智能策略模型。這種多智能體協作決策模型也是人工智能領域實現吃豆人游戲最高分數的設計關鍵。該計算模型首先設計了一組策略基組,策略基組中每個策略都只解決游戲中一個子任務,例如覓食最近的食物、躲避敵人追擊或者通過能量豆食物改變敵人的狀態,其次,該模型將不同的策略基組對比擬合到到獼猴的游戲行為數據中,推斷策略的動態權重。該計算模型對獼猴手柄運動的預測準確率能夠達到90%以上。更重要的是,通過策略動態權重的分析,發現獼猴通過使用分而治之的啟發式方法,在每個時間只關注游戲的一個子任務,分布式地解決這些問題,從而實現對游戲總體目標的優化。更令人感到吃驚的是,研究發現獼猴能夠在時序上組合這些策略基組,構建更為復雜的復合策略,來處理特定的更有挑戰性的任務。以上的研究結果表明,獼猴能夠優化掌握一套策略基組,并采用分層決策的方式來解決十分復雜的任務(圖B)。 

  本研究著眼于系統認知神經科學和人工智能廣泛關注的交叉領域,將復雜的行為范式和嚴謹的計算建模進行結合,為未來研究靈長類動物的高級認知提供了重要的實驗證據和新穎的分析方法。 

  該研究由博士后楊千里、林中喬,博士生張文怡、陳希源,以及工作人員李建澍和張嘉琦在楊天明研究員的指導下完成,研究組的其他成員也在課題的各個階段給予了幫助。該工作得到科技部、中科院、上海市科委和基金委的資助。 

 

  圖注(A)吃豆人行為范式。 (B) 獼猴用分層決策的策略解決吃豆人任務。該策略在最低級別,為操縱桿的移動做出決定:向上、向下、向左或向右。在中間層,在策略基組之間進行選擇。在更高的層次上,可以將簡單的策略拼湊成更復雜的復合策略基組。 

附件下載: 
    亚洲日韩中文无码专区_亚洲日韩中文l第一精品_亚洲日韩中文aⅴ_亚洲日韩中看片无码电影
    <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>|