
【獵云網(微信號:ilieyun)】5月26日報道(編譯:蔡妙嫻)
編者注:本文作者Will Knight是MIT Technology Review中AI版塊的高級主編,他向我們分享了人工智能和好奇心的關系。
如果計算機程序遇到棘手的問題,無法第一時間搜索到解決方案怎么辦?科學家說,讓人工智能具備好奇心可能是最終答案。
加州大學伯克利分校的研究人員開發了“內在好奇心模型”,讓人工智能算法在沒有強反饋信號的時候,仍然主動進行學習。開發這一模型的團隊在玩游戲時受到了啟發。他們希望能夠用人工智能軟件控制虛擬人物,提升人物對游戲環境的理解,尤其是影響其自身的一些方面。雖然此前也有其他研究人員嘗試給人工智能“裝上”好奇心,但往往都非常簡單。
如果人工智能真的能擁有好奇心,那么今天我們所面對的大多數機器學習技術弊端將得到解決,同時,我們也能讓機器更好地服務于現實世界的問題。
Pulkit Agrawal是加州大學伯克利分校的博士學生,同時也是該項目研究成員之一,他說:“在現實世界中,好奇心所能獲得的回報太少了。小寶寶們經常有這種實驗行為,你可以把它看作一種好奇。其實,他們是在學習某種技能。”
近幾年來,一些強大的機器學習技術已經讓機器一天比一天聰明。值得一提的是,一種名為增強學習的技術已經能讓機器解決復雜問題,而這些問題如果轉換成代碼是非常困難的。在進行增強學習的過程中,算法作出正確決策會得到獎勵,從而引導算法行為朝著目標方向邁進。
在DeepMind開發的AlphaGo中,增強學習技術也為其提供了基礎,才使AlphaGo能夠把復雜抽象的圍棋玩得那么溜。研究人員表示,探索增強學習技術的使用途徑或將使機器具備人工編程無法設計的技能。比方說,未來的機械手臂可以自己訓練,學會如何做家務。
不過,增強學習技術也有局限性。Agrawal指出,指導機器學會一項技能需要大量訓練工作,而如果不能立即得到訓練反饋,這個過程還要更加困難。舉例來說,在訓練機器玩游戲時這項技術就不好使,因為某些操作可能不會立即顯現出效果。這種情況下,如果機器有好奇心就好了。
于是,研究人員試著給機器“裝上”好奇心,并結合增強學習技術,拿兩款簡單小游戲做了實驗。一款是經典游戲《馬里奧兄弟》,另一款是基礎3D射擊游戲VizDoom。
在兩個游戲中,擁有好奇心的人工智能系統學習起來要更有效率。比如說玩3D游戲的時候,人工智能系統沒有花多少時間撞墻,而是在游戲環境中走來走去,學習如何快速移動。即便沒有看到任何回報,它還是非常出色地掌握了兩款游戲。在《馬里奧兄弟》中,它學會了觀察周圍環境,不會莫名其妙就被殺掉。
今年晚些時候,總結此次研究的論文將會在一場大型人工智能會議上發布。
“給人工智能系統裝上好奇心”這一研究課題稱為熱門已經有一陣子了。法國計算機科學與自動化研究機構的研究主管Pierre-Yves Oudeyer是這方面的“拓荒者”,在過去幾年里,他率先對計算機程序及機器人的基礎好奇心項目進行了研究。
Oudeyer表示:“現在讓我覺得激動的是,被主流人工智能技術和神經科學研究人員當作‘詭思異談’的時代已經過去了,現在“給人工智能系統裝上好奇心”正成為人工智能和神經科學領域的重要主題。”
人工智能搭上好奇心將帶來許多實實在在的好處。加州大學伯克利分校的團隊希望能在機器人身上運用這一技術,讓機器人學會如何抓住笨拙的物體。Agrawal說,機器人往往浪費大量時間進行無意義的動作,而如果它們天生擁有好奇心,那么或許可以更快地了解周圍環境,和身邊的物體積極進行互動。
紐約大學科學研究員Brenden Lake致力于開發擁有人類認知能力的計算模型,在他看來,上述研究是很有前景的。Lake在一封郵件中說:“讓機器擁有好奇心等能力是往前邁了重要一步,讓我們離開發出具備等同于人類的學習、思考能力的機器人又近了許多。令我驚訝的是,僅僅依靠好奇心驅動學習技術,人工智能系統居然能在馬里奧游戲里升級,要知道那系統根本就沒有關注得分。”
與此同時,Lake也表示,這一新項目所展示的人工智能好奇心,和孩子的好奇心還是不同的。人類對世界的求知欲往往更強烈一些。
“這是一種非常以自我為中心的好奇心。”Lake說道。
“人工智能系統只關心與自己有關的環境特點。而人的求知范圍要更廣。人們想了解的,不僅僅是與自身行為有關的世界。”
本文來自獵云網,如若轉載,請注明出處:http://www.lieyunwang.com/archives/315484