人工智能先鋒Stuart Russell：智能和人工智能安全的巨大挑戰(zhàn)

2015/05/28 09:52 tino

今年一月，英裔美籍計(jì)算機(jī)科學(xué)家Stuart Russell起草了一份公開信，他也是這份公開信首位簽署人，在這份公開信中，Stuart Russell呼吁研究人員，雖然當(dāng)前大家的目標(biāo)是希望人工智能變得強(qiáng)大，但千萬(wàn)不要鼠目寸光，局限在這個(gè)目標(biāo)上面。在這份公開信中寫道，“我們提醒研究人員注意，隨著人工智能系統(tǒng)的能力越來(lái)越強(qiáng)大，我們希望這個(gè)系統(tǒng)更加穩(wěn)定，同時(shí)也要對(duì)人類有益。我們的人工智能系統(tǒng)，必須要做人類要求它們做的東西。”目前，已經(jīng)有數(shù)千人在這份公開信上簽名，包括谷歌，F(xiàn)acebook，微軟公司內(nèi)研究人工智能的專家，以及全球其他行業(yè)中心里的頂尖計(jì)算機(jī)科學(xué)家，物理學(xué)家，以及哲學(xué)家。在今年三月底，大約有300名研究人員開啟了一項(xiàng)新研究，希望讓人工智能對(duì)人類更加有益，而資助這份研究的資金則是由該公開信的第37位簽署人贊助的，他就是現(xiàn)實(shí)版“鋼鐵俠”Elon Musk。

Russell今年53歲，是加州大學(xué)伯克利分校人工智能系統(tǒng)中心創(chuàng)始人兼計(jì)算機(jī)科學(xué)專業(yè)教授，他一直在關(guān)注人工智能的發(fā)展和影響。Russell寫了200多頁(yè)的論文，同時(shí)他還是人工智能領(lǐng)域里“標(biāo)準(zhǔn)教科書”-----《人工智能：一種現(xiàn)代化方法》作者（谷歌研究主管Peter Norvig也是該書作者）。但是，隨著人工智能發(fā)展的速度越來(lái)越快，加劇了Russell對(duì)這一領(lǐng)域的擔(dān)憂。

近日他表示，人工智能有了很大跨越，很大程度上是因?yàn)樯窠?jīng)網(wǎng)絡(luò)學(xué)習(xí)算法有了質(zhì)的飛躍。相關(guān)技術(shù)已經(jīng)應(yīng)用在Facebook的人臉識(shí)別軟件，智能手機(jī)的私人助手應(yīng)用，以及谷歌的自動(dòng)駕駛汽車上面了。還有一個(gè)現(xiàn)實(shí)中的例子，根據(jù)《自然》雜志上最近刊登的一項(xiàng)研究成果，一個(gè)人工神經(jīng)模擬網(wǎng)絡(luò)學(xué)習(xí)玩兒雅達(dá)利公司的視頻游戲，結(jié)果玩兒的竟然比人類還要好，這也引起了業(yè)界震動(dòng)。“如果這發(fā)生在一個(gè)剛出生的孩子身上，你會(huì)認(rèn)為，這是與生俱來(lái)的。”Russell說(shuō)到。

今年，在德克薩斯州圣安東尼奧市舉辦的美國(guó)物理學(xué)會(huì)2015年會(huì)上，Russell接受了Quanta Magazine的采訪，并談?wù)摿酥悄鼙举|(zhì)和人工智能安全的巨大挑戰(zhàn)。

你認(rèn)為，人工智能的目標(biāo)就是要能證明它能符合人類價(jià)值觀，這意味著什么？

這么說(shuō)真有點(diǎn)兒氣人吶，這里把兩件事情放在在了一起，一個(gè)是要“能證明”，另一個(gè)是“人類價(jià)值觀”，它們貌似就是非常矛盾的。人類價(jià)值觀本身就多少存在一些神秘，從某種程度上，我們的價(jià)值觀會(huì)在行為上有所表現(xiàn)，你可能希望證明機(jī)器也能做出絕大多數(shù)類似的行為吧?；蛟S，機(jī)器會(huì)有一些零碎的東西無(wú)法理解，而實(shí)際上，就連人類自己有時(shí)都不太認(rèn)可彼此。不過(guò)，只要機(jī)器能夠獲得基本權(quán)利，你可能就會(huì)發(fā)現(xiàn)它們其實(shí)并不是非常有害的。

你會(huì)如何著手實(shí)現(xiàn)這些？

這個(gè)問(wèn)題其實(shí)就是我現(xiàn)在的工作：機(jī)器需要在什么地方擁有一些近似于價(jià)值觀的東西呢？重要的是，這些價(jià)值觀必須是人類希望他們擁有的。我認(rèn)為答案就是一種名叫“逆向增強(qiáng)學(xué)習(xí)”的技術(shù)。普通的增強(qiáng)學(xué)習(xí)是一種過(guò)程，你會(huì)根據(jù)自己的表現(xiàn)得到一定的獎(jiǎng)勵(lì)和懲罰，你的目標(biāo)就是要識(shí)別出一些能讓你獲得最多獎(jiǎng)勵(lì)的行為。這就是【雅達(dá)利游戲公司】DQN系統(tǒng)正在做的事情；它給每個(gè)游戲分?jǐn)?shù)，而這套系統(tǒng)的目標(biāo)，就是要讓分?jǐn)?shù)變得越來(lái)越大。逆向增強(qiáng)學(xué)習(xí)恰恰與之相反，你會(huì)發(fā)現(xiàn)一些行為，然后你需要嘗試搞清楚這種行為嘗試最大化的那個(gè)分?jǐn)?shù)是多少。舉個(gè)例子，你的家用機(jī)器人看到你早上從床上爬起來(lái)，然后把一些褐色的玩意兒放進(jìn)一臺(tái)噪音很大的機(jī)器里磨碎，然后再把一些蒸汽、熱水、牛奶和這個(gè)液體混合在一起，一飲而盡之后，精神就會(huì)變得非常好。此時(shí)，逆向增強(qiáng)學(xué)習(xí)技術(shù)就需要學(xué)習(xí)，這其實(shí)就是人類在清晨?jī)r(jià)值功能的一部分，因?yàn)樗麄冃枰瓤Х取?/p>

關(guān)于人類行為和行為態(tài)度，在書本、電影、已經(jīng)互聯(lián)網(wǎng)之外，其實(shí)存在著大量信息。因此，當(dāng)涉及到人類價(jià)值時(shí)，機(jī)器需要學(xué)習(xí)的資源是非常龐大的，比如誰(shuí)贏了比賽金牌，誰(shuí)去坐牢，以及為什么會(huì)這樣。

您是怎么進(jìn)入到人工智能這一領(lǐng)域里的？

當(dāng)我還在學(xué)習(xí)讀書的時(shí)候，總體來(lái)說(shuō)，人工智能還不是一種正式的學(xué)術(shù)科目。但是當(dāng)時(shí)我所在的是倫敦的一家公立寄宿學(xué)校，位于圣保羅，所以我的時(shí)間沒(méi)有花在打英式橄欖球上，相反，在附近的一所高校里，我學(xué)習(xí)了計(jì)算機(jī)科學(xué)A-level課程。我當(dāng)時(shí)為A-level課程準(zhǔn)備了一個(gè)項(xiàng)目，就是編了一個(gè)程序教自己下井字棋，或是一字棋。當(dāng)時(shí)我在那里并不受到人們歡迎，因?yàn)槲铱偸且贿B幾個(gè)小時(shí)霸占著學(xué)校里的計(jì)算機(jī)。第二年，我寫了一個(gè)國(guó)際象棋程序，同時(shí)也獲得了帝國(guó)理工大學(xué)教授的許可，可以使用他們學(xué)校里的大型計(jì)算機(jī)。搞清楚計(jì)算機(jī)如何學(xué)習(xí)下棋真的太有意思了，我學(xué)到了很多今后會(huì)在書本上學(xué)到的東西。

不過(guò)怎么說(shuō)呢，當(dāng)時(shí)我還只是把這個(gè)當(dāng)做是一個(gè)愛好；因?yàn)楫?dāng)時(shí)我最感興趣的學(xué)科專業(yè)是物理。我在牛津大學(xué)學(xué)習(xí)了物理學(xué)，之后當(dāng)我申請(qǐng)讀研究生的時(shí)候，也是申請(qǐng)了在牛津和劍橋繼續(xù)攻讀理論物理專業(yè)。后來(lái)我又申請(qǐng)了麻省理工學(xué)院，卡耐基-梅隆大學(xué)和斯坦福大學(xué)三所高校的計(jì)算機(jī)科學(xué)專業(yè)，但不幸的是，當(dāng)時(shí)我錯(cuò)過(guò)了申請(qǐng)截止日期，好在斯坦福大學(xué)網(wǎng)開一面，于是我來(lái)到了斯坦福大學(xué)。

所以，您來(lái)美國(guó)之后就一直生活在西海岸？

是的。

在您整個(gè)職業(yè)生涯里，花了大量時(shí)間嘗試?yán)斫馊斯ぶ悄苁鞘裁?，這也是搞清楚機(jī)器會(huì)如何實(shí)現(xiàn)人工智能的先決條件。從中您學(xué)到了些什么？

在上世紀(jì)80年代，我進(jìn)行了理論研究，當(dāng)時(shí)我開始思考制定理性決策，但問(wèn)題是，這個(gè)問(wèn)題是不可能解決的。如果你非常理性，你可能會(huì)向：這是我目前的狀態(tài)，這是我現(xiàn)在能做的行為，之后我可以做那些行為，接著是那些行為，再接著又是那些行為。哪條路徑能確保實(shí)現(xiàn)我的目標(biāo)呢？理性行為的定義，要求你去優(yōu)化整個(gè)宇宙的未來(lái)，這靠計(jì)算是根本不可能實(shí)現(xiàn)的。

在人工智能中，也有些事情是不可能實(shí)現(xiàn)的，因此我們?nèi)ザx那些我們正在嘗試所做的事情，其實(shí)根本沒(méi)有什么意義，所以，我決定嘗試搞明白：我們究竟是如何做決策的？

那么，我們是怎么做的呢？

這里有一個(gè)技巧，你可以去思考一個(gè)短期預(yù)測(cè)，然后再去猜測(cè)未來(lái)會(huì)是什么樣子。因此，舉個(gè)例子，在國(guó)際象棋程序里，如果他們非常理性，那么他們就只會(huì)走那些能確保將死對(duì)方的棋，但實(shí)際上，他們并不會(huì)這么做。他們會(huì)算一下未來(lái)要走的幾步棋，然后再猜測(cè)一下，如果這么走，對(duì)于當(dāng)前自己的棋局是否有幫助，最后，他們會(huì)選擇走一步對(duì)自己當(dāng)前棋局最為有利的一步棋。

“你能證明你的系統(tǒng)，無(wú)論他們有多么智能，都不會(huì)重寫系統(tǒng)內(nèi)部最初由人類設(shè)置的那個(gè)目標(biāo)嗎？”

實(shí)際上，真正需要重點(diǎn)考慮的另一件事情，就是在多個(gè)抽象級(jí)別里的決策問(wèn)題，也就是所謂的“分層決策”。在一個(gè)人一生之中，大約要做20萬(wàn)億個(gè)物理動(dòng)作。舉個(gè)例子，在本屆大會(huì)上做一次演講，需要作出大約13億個(gè)物理動(dòng)作。如果你是理性的，那么就會(huì)預(yù)先想好會(huì)怎么做這13億個(gè)物理動(dòng)作，顯然，這非?；闹?，同樣也是不可能實(shí)現(xiàn)的。因此，如果人們想要能夠進(jìn)行目標(biāo)管理，就需要非常豐富的高層次抽象行為庫(kù)。你走路的時(shí)候會(huì)去想，“首先我要么移動(dòng)我的左腳，要么移動(dòng)我的右腳，之后我要么移動(dòng)…”會(huì)這樣想嗎？顯然不會(huì)。那么你會(huì)想些什么呢？你會(huì)想“我得趕緊去艾派迪旅游公司，然后訂一個(gè)航班。當(dāng)我落地之后，我要打個(gè)的。”這才是人類會(huì)想的東西。在我的飛機(jī)實(shí)際落地之前，我是不會(huì)去想任何東西的，也不會(huì)去找出租車標(biāo)記，或是叫車，但是當(dāng)我落地之后，我會(huì)需要更多細(xì)節(jié)?；旧?，這才是我們真正的生活，未來(lái)是鋪開的，很多細(xì)節(jié)能夠及時(shí)的靠近我們，但是很多大塊、或是人生的大方向卻是非常抽象的，比如“我要考博士”，“我要生孩子”，等等。

目前的計(jì)算機(jī)能做分層決策嗎？

這正是目前人工智能所缺失的那一部分，所有這些高級(jí)別行為都來(lái)自什么地方？我們不認(rèn)為像DQN網(wǎng)絡(luò)這樣的程序可以識(shí)別行為的抽象表達(dá)。有一些游戲，DQN還不知道怎么玩兒，那些難度較高的游戲需要在原始行為表現(xiàn)的基礎(chǔ)上，向前思考很多很多步，舉個(gè)例子，如果一個(gè)人想，“哦！我現(xiàn)在需要做的，是去開門。”，而開門則需要涉及到拿鑰匙，等等。如果機(jī)器沒(méi)有“開門”這個(gè)行為表現(xiàn)，那么在這個(gè)任務(wù)上就不會(huì)有任何進(jìn)展。

但是，如果問(wèn)題被解決（當(dāng)然這幾乎是不可能的），那么我們就會(huì)看到機(jī)器能力將得到極大的提升。我個(gè)人其實(shí)也不太確定，在人類級(jí)別的人工智能和計(jì)算機(jī)分層決策問(wèn)題之間的主要障礙是什么。

對(duì)于人類級(jí)別人工智能的可能性，您關(guān)注的是什么？

1994年，在我首版書中有一個(gè)章節(jié)，題目叫做“如果我們成功了會(huì)怎樣？”因?yàn)樵谖铱磥?lái)，對(duì)于人工智能似乎大家還沒(méi)有真正思考過(guò)這個(gè)問(wèn)題?；蛟S可能因?yàn)檫@距離我們非常遙遠(yuǎn)，但很顯然，如果人工智能獲得成功，那無(wú)疑將會(huì)是一件大事，甚至?xí)侨祟悮v史上最重大的事件，我們需要用一種較好的方式去描述它。如果這事兒真的成了，那么我們就需要做非常多的思考，至少，要比我們現(xiàn)在正在思考未來(lái)會(huì)是什么樣多得多。

智能爆炸的基本概念，就是一旦機(jī)器獲得了一定級(jí)別的智能水平，他們就能在人工智能上工作，就像我們做的那樣，同時(shí)還會(huì)提升他們自己的能力，重新設(shè)計(jì)他們自己的硬件，等等。同時(shí)，他們的智能將會(huì)破紀(jì)錄般地被放大。在過(guò)去的幾年里，人工智能圈子已經(jīng)逐漸開始重新定義人類級(jí)別人工智能參數(shù)（這可能會(huì)是個(gè)問(wèn)題），其中最令人信服的參數(shù)必須是要和價(jià)值參數(shù)有關(guān)：你構(gòu)建了而一個(gè)系統(tǒng)，在優(yōu)化效用函數(shù)上表現(xiàn)的非常好，但是效用函數(shù)并不是非常正確的。牛津大學(xué)哲學(xué)家Nick Bostrom寫了一本書，叫做《超級(jí)智能》，他用回紋針作為例子，你說(shuō)，“做些回紋針”。它就將整個(gè)星球變成一個(gè)巨大的回紋針堆積場(chǎng)。你構(gòu)建了一個(gè)超級(jí)優(yōu)化程序；你會(huì)給它什么樣的效用函數(shù)呢？因?yàn)檫@個(gè)程序就要打算這么干了！

人類價(jià)值觀的差異呢？

那是個(gè)內(nèi)在問(wèn)題。你可以說(shuō)，當(dāng)有某個(gè)領(lǐng)域出現(xiàn)了價(jià)值觀沖突的時(shí)候，機(jī)器應(yīng)該寧可什么都不做。但這是很難實(shí)現(xiàn)的。我認(rèn)為，我們不得不在某些價(jià)值功能的基礎(chǔ)上構(gòu)建人工智能。如果你想要一個(gè)家庭機(jī)器人，它就必須要很好地分享人類價(jià)值觀的不同部分，否則它很可能會(huì)做一些非常愚蠢的事情，比如當(dāng)孩子肚子餓了，并且冰箱里沒(méi)有食物了，它可能就會(huì)把貓放進(jìn)烤箱里做晚飯?，F(xiàn)實(shí)生活中充滿了類似的權(quán)衡，如果機(jī)器可以有一些折中的方式，那么它們?cè)谏钪芯筒粫?huì)做出那些愚蠢的事情。

從某種意義上來(lái)說(shuō)，在價(jià)值觀領(lǐng)域里，我沒(méi)有看到任何的解決方案。我同時(shí)還覺(jué)得，如果人工智能可以判斷正確的人類價(jià)值觀，那么可能會(huì)帶來(lái)巨大的經(jīng)濟(jì)利益。舉個(gè)例子，一旦家庭機(jī)器人做出一兩次愚蠢的事情，如同前文講的把貓放進(jìn)烤箱，那么人們肯定再也不會(huì)買這種類型的機(jī)器人了。

但同時(shí)還有一個(gè)問(wèn)題，如果智能系統(tǒng)自我表現(xiàn)行為符合人類價(jià)值觀，那么人類就會(huì)過(guò)渡到越來(lái)越多的智能系統(tǒng)上面，這是否意味著人類自己的價(jià)值觀要變得越來(lái)越好？還是繼續(xù)表現(xiàn)自我？我不知道答案。

您曾經(jīng)說(shuō)過(guò)，我們需要通過(guò)數(shù)學(xué)驗(yàn)證人工智能在所有可能的環(huán)境下表現(xiàn)出的行為，這該怎么做呢？

人們指出的困難之一，就是一個(gè)智能系統(tǒng)可以武斷地制造出一個(gè)全新的“自我”，而這個(gè)新智能系統(tǒng)的目標(biāo)和原來(lái)的老智能系統(tǒng)也是不同的。這種場(chǎng)景，相比很多科幻小說(shuō)作家會(huì)經(jīng)常提及，在某種程度上，機(jī)器會(huì)自發(fā)地達(dá)到戰(zhàn)勝人類的目標(biāo)。所以問(wèn)題來(lái)了：你能證明你的系統(tǒng)無(wú)論它多么智能，都永遠(yuǎn)永遠(yuǎn)不會(huì)重寫自己最初由人類設(shè)置的目標(biāo)嗎？

證明這點(diǎn)還是相當(dāng)容易的，正如前文所提到的DQN系統(tǒng)，它可以永遠(yuǎn)不去改變自己“優(yōu)化游戲分?jǐn)?shù)”的目標(biāo)?，F(xiàn)在，有一次網(wǎng)絡(luò)攻擊，就是人們談?wù)摫环Q為“wire-heading”的網(wǎng)絡(luò)攻擊，它讓你可以實(shí)際進(jìn)入到雅達(dá)利游戲的控制臺(tái)，手工改變屏幕上生成的分?jǐn)?shù)。此時(shí)對(duì)DQN是不可行的，因?yàn)樗男袨榉秶峭耆谟螒虮旧碇械?；它沒(méi)有機(jī)器人手臂去干這種事兒。不過(guò)，如果機(jī)器在現(xiàn)實(shí)世界中有了行動(dòng)能力，那就會(huì)帶來(lái)嚴(yán)重的問(wèn)題。因此，你能夠證明你設(shè)計(jì)的系統(tǒng)在自身行為范圍之內(nèi)，永遠(yuǎn)不會(huì)改變自身機(jī)制嗎？這更難證明了。

如果朝著人工智能這個(gè)方向有什么進(jìn)展的話，您覺(jué)得會(huì)很有希望嗎？

目前有一個(gè)新興的行業(yè)領(lǐng)域，叫做“網(wǎng)絡(luò)-實(shí)體系統(tǒng)”，這個(gè)系統(tǒng)可以將虛擬環(huán)境與真實(shí)世界進(jìn)行匹配。在網(wǎng)絡(luò)-實(shí)體系統(tǒng)中，你可以用一些二進(jìn)制數(shù)字來(lái)代表一個(gè)空中交通管制程序，然后你可以獲得一些真實(shí)的飛機(jī)，而你真正關(guān)心的是，不要發(fā)生飛機(jī)碰撞。你要試圖去證明一個(gè)關(guān)于虛擬和真實(shí)世界整合的定理，此時(shí)你會(huì)怎么做呢？你會(huì)對(duì)真實(shí)世界進(jìn)行非常保守的數(shù)學(xué)描述，比如飛機(jī)在這樣或那樣的環(huán)境下可以加速，等等，你的定理在真實(shí)世界中會(huì)是正確的，只要真實(shí)世界能夠包含在你的整體行為環(huán)境之中。

但是，你已經(jīng)指出，數(shù)學(xué)方法可能無(wú)法作為人工智能系統(tǒng)的正式驗(yàn)證方法

在數(shù)學(xué)專業(yè)里有個(gè)術(shù)語(yǔ)，叫做“不可判定性”。在你所問(wèn)到關(guān)于計(jì)算機(jī)程序的很多問(wèn)題之中，其實(shí)都存在這樣一個(gè)普遍的“不可判定性”問(wèn)題。著名的計(jì)算機(jī)科學(xué)之父，也是人工智能之父阿蘭·圖靈說(shuō)過(guò)，沒(méi)有計(jì)算機(jī)程序能夠決定是否存在任何其他可能的程序可以最終終止，并輸出一個(gè)答案，或是陷入到一個(gè)無(wú)限循環(huán)之中。因此，如果你開始了一個(gè)程序，但是它自身可以重寫，變成另外一個(gè)其他程序，那么就會(huì)產(chǎn)生問(wèn)題，因?yàn)槟悴荒茏C明所有其他可能的程序會(huì)讓一些“所有權(quán)”滿意。所以問(wèn)題就是：是否有必要擔(dān)心那些能夠自我重寫的人工智能系統(tǒng)的不可判定性？它們會(huì)基于現(xiàn)有程序，加上它們?cè)谡鎸?shí)世界中的經(jīng)驗(yàn)，自我重寫成一個(gè)新的程序。在下一個(gè)程序如何設(shè)計(jì)的問(wèn)題上，與真實(shí)世界交互的影響范圍可能性又是什么？目前，我們貌似還沒(méi)有太多這方面的知識(shí)。

via wired, 快鯉魚翻譯，轉(zhuǎn)載標(biāo)明出處

人工智能先鋒Stuart Russell：智能和人工智能安全的巨大挑戰(zhàn)

相關(guān)閱讀

實(shí)時(shí)更新

新聞排行榜

熱門話題

關(guān)注挖貝