婷婷在线视频精品免费_亚洲毛片无码专区亚洲乱_国产一区二区三区撒尿在线观看_日韩另类卡通爆乳在线

首頁(yè)  ?  科學(xué)  ?  科學(xué)探索

無(wú)需調(diào)控而勝任不同任務(wù) 這種AI更接近人類思考方式

2019-12-04 08:47:42

來(lái)源: 科技日?qǐng)?bào)

  紐約大學(xué)心理學(xué)與認(rèn)知科學(xué)教授馬庫(kù)斯最近和人工智能企業(yè)“深層思維”(DeepMind)杠上了。繼前不久在推特(Twitter)上質(zhì)疑美國(guó)通用人工智能研究組織OpenAI的解魔方機(jī)械手之后,近日他又對(duì)“深層思維”新推出的《星際爭(zhēng)霸2》智能體“阿爾法星”(AlphaStar)進(jìn)化版提出六大質(zhì)疑。此次,他的質(zhì)疑點(diǎn)并不是游戲表現(xiàn)本身,而是指向了更高的層面:未來(lái)通用智能研究的意義。

  近年最酷成果都來(lái)自深度強(qiáng)化學(xué)習(xí)

  此次OpenAI推出的解魔方機(jī)器手,并不是像以往一樣使用專業(yè)算法來(lái)解決某一個(gè)特定任務(wù)(如果換一個(gè)任務(wù),還需要重新編程),而是通過(guò)某種學(xué)習(xí)方法,對(duì)機(jī)器人進(jìn)行訓(xùn)練,讓機(jī)械手具備類人手的解決問(wèn)題的能力。但馬庫(kù)斯卻認(rèn)為這個(gè)成果描述有誤導(dǎo),更恰當(dāng)?shù)拿枋鰬?yīng)該是“用強(qiáng)化學(xué)習(xí)操縱魔方”或者是“用靈巧的機(jī)器人手操縱物體的進(jìn)展”。

  “馬庫(kù)斯過(guò)于強(qiáng)調(diào)‘用強(qiáng)化學(xué)習(xí)操縱魔方’有點(diǎn)挑剔字眼,其實(shí)OpenAI魔方機(jī)器手和‘深層思維’發(fā)布的《星際爭(zhēng)霸2》智能體‘阿爾法星’進(jìn)化版都使用了深度強(qiáng)化學(xué)習(xí)技術(shù)。深度強(qiáng)化學(xué)習(xí)是目前公認(rèn)的在現(xiàn)有技術(shù)中最有可能實(shí)現(xiàn)通用人工智能的技術(shù)?!碧旖虼髮W(xué)智能與計(jì)算學(xué)部軟件學(xué)院副教授郝建業(yè)解釋說(shuō),目前機(jī)器學(xué)習(xí)有三大分支,監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí),深度學(xué)習(xí)屬于監(jiān)督學(xué)習(xí)里目前最主流的一類技術(shù)。深度強(qiáng)化學(xué)習(xí)是深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的融合,是將深度神經(jīng)網(wǎng)絡(luò)整合到強(qiáng)化學(xué)習(xí)框架當(dāng)中。

  “近幾年,深度強(qiáng)化學(xué)習(xí)發(fā)展迅猛,它在處理復(fù)雜、多方面和決策問(wèn)題方面顯示出巨大的潛力。目前深度強(qiáng)化學(xué)習(xí)技術(shù)主要應(yīng)用在一些游戲、比賽中。”郝建業(yè)介紹,2016年,谷歌的“阿爾法圍棋”(AlphaGo)擊敗了世界頂級(jí)圍棋選手李世石、柯潔,轟動(dòng)一時(shí),成為人工智能領(lǐng)域的一個(gè)里程碑?!鞍柗▏濉钡暮诵木驮谟谑褂昧松疃葟?qiáng)化學(xué)習(xí)算法,使得計(jì)算機(jī)能夠通過(guò)自對(duì)弈的方式不斷提升棋力。此后又有臉書(shū)(Facebook)在DOTA2游戲中打敗了頂級(jí)職業(yè)選手;CMU團(tuán)隊(duì)研發(fā)的德州撲克AI冷撲大師輕松擊敗頂級(jí)玩家。

  此外,“深層思維”還運(yùn)用深度強(qiáng)化學(xué)習(xí)優(yōu)化了數(shù)據(jù)中心的耗能;谷歌則利用深度強(qiáng)化學(xué)習(xí)完成深度神經(jīng)網(wǎng)絡(luò)的自動(dòng)架構(gòu)搜索,提出了AutoML服務(wù),借此將機(jī)器學(xué)習(xí)作為一種服務(wù)推廣到千家萬(wàn)戶。在我國(guó),對(duì)于深度強(qiáng)化學(xué)習(xí)技術(shù)的應(yīng)用也不少,阿里、騰訊、百度等國(guó)內(nèi)團(tuán)隊(duì)將深度強(qiáng)化學(xué)習(xí)應(yīng)用到搜索、推薦、營(yíng)銷、派單和路徑規(guī)劃等實(shí)際問(wèn)題的決策中。

  最有可能實(shí)現(xiàn)通用人工智能的技術(shù)

  人工智能發(fā)展到現(xiàn)在的高度,技術(shù)上較大的功臣應(yīng)該屬于深度學(xué)習(xí)算法。深度學(xué)習(xí)利用多層神經(jīng)網(wǎng)絡(luò),從海量的數(shù)據(jù)中學(xué)習(xí),從而實(shí)現(xiàn)對(duì)未來(lái)的預(yù)測(cè),并使人工智能系統(tǒng)越來(lái)越智能。目前我們應(yīng)用的安防監(jiān)控、自動(dòng)駕駛、語(yǔ)音識(shí)別、百度地圖等都是深度學(xué)習(xí)技術(shù)在圖像視覺(jué)、語(yǔ)音識(shí)別、自然語(yǔ)言理解等領(lǐng)域的應(yīng)用。

  而強(qiáng)化學(xué)習(xí)也是目前機(jī)器學(xué)習(xí)領(lǐng)域的熱門技術(shù),與基于已知標(biāo)簽訓(xùn)練模型的監(jiān)督學(xué)習(xí)不同,強(qiáng)化學(xué)習(xí)能夠在沒(méi)有計(jì)算機(jī)的明確指示下,像人一樣實(shí)現(xiàn)自主學(xué)習(xí)。當(dāng)達(dá)到一定的學(xué)習(xí)量之后,強(qiáng)化學(xué)習(xí)系統(tǒng)就能夠預(yù)測(cè)出正確的結(jié)果。“強(qiáng)化學(xué)習(xí)的基本思想是,學(xué)習(xí)在不同環(huán)境和不同狀態(tài)下,哪種行為能夠使得預(yù)期利益最大化?!焙陆I(yè)介紹,新版“阿爾法星”智能體就采用了強(qiáng)化學(xué)習(xí)的自對(duì)戰(zhàn)技術(shù),其學(xué)習(xí)過(guò)程不需要數(shù)據(jù)標(biāo)注,而是由獎(jiǎng)勵(lì)函數(shù)進(jìn)行主導(dǎo)。智能體獲得獎(jiǎng)勵(lì)得分或贏得一場(chǎng)比賽,它會(huì)得到積極的反饋,智能體就會(huì)根據(jù)對(duì)戰(zhàn)的成績(jī)好壞,來(lái)調(diào)整行為動(dòng)作。這猶如嬰兒學(xué)走路,會(huì)根據(jù)產(chǎn)生的結(jié)果好壞來(lái)調(diào)整行為動(dòng)作。

  目前對(duì)通用人工智能的定義主要有兩個(gè)特點(diǎn),一是端對(duì)端的學(xué)習(xí),二是任務(wù)自適應(yīng),?無(wú)需人類參與調(diào)控而勝任不同的任務(wù)。深度強(qiáng)化學(xué)習(xí)可以將深度學(xué)習(xí)的感知能力和強(qiáng)化學(xué)習(xí)的決策能力相結(jié)合,直接根據(jù)輸入的信息進(jìn)行控制,是一種更接近人類思維方式的人工智能技術(shù)。在與世界的正?;?dòng)過(guò)程中,強(qiáng)化學(xué)習(xí)會(huì)通過(guò)試錯(cuò)法利用獎(jiǎng)勵(lì)來(lái)學(xué)習(xí),這跟自然學(xué)習(xí)過(guò)程非常相似。比如單手解魔方機(jī)器手,它可能需要利用深度學(xué)習(xí)的識(shí)圖技術(shù)等看到魔方,而后還需強(qiáng)化學(xué)習(xí)的模型讓機(jī)器手在不斷的試錯(cuò)過(guò)程中自主學(xué)習(xí)。在強(qiáng)化學(xué)習(xí)中,可以使用較少的訓(xùn)練信息,這樣做的優(yōu)勢(shì)是信息更充足,而且不受監(jiān)督者技能限制。深度強(qiáng)化學(xué)習(xí)朝構(gòu)建對(duì)世界擁有更高級(jí)理解的自主系統(tǒng)又邁出了一步,這也是為什么說(shuō)深度強(qiáng)化學(xué)習(xí)是目前公認(rèn)的在現(xiàn)有技術(shù)中最有可能實(shí)現(xiàn)通用人工智能的技術(shù)。

  未來(lái)通用人工智能還需依托腦科學(xué)發(fā)展

  “雖然說(shuō)深度強(qiáng)化學(xué)習(xí)技術(shù)最有可能實(shí)現(xiàn)通用人工智能,但是并不能說(shuō)就一定能夠?qū)崿F(xiàn),我們離真正的通用人工智能還是有很大差距的。”郝建業(yè)表示,深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)結(jié)合的時(shí)候,對(duì)現(xiàn)實(shí)情況的枚舉就變成首先需要對(duì)現(xiàn)實(shí)情況進(jìn)行模式識(shí)別,然后進(jìn)行有限模式的枚舉,從而減少計(jì)算的壓力,但是所需的數(shù)據(jù)將比其他機(jī)器學(xué)習(xí)算法要大得多。如果將場(chǎng)景擴(kuò)展到多智能體的深度強(qiáng)化學(xué)習(xí),那么需要的數(shù)據(jù)和算力是呈指數(shù)級(jí)上升的,目前還沒(méi)有平臺(tái)能夠提供強(qiáng)化學(xué)習(xí)所需要的海量數(shù)據(jù),無(wú)法窮舉現(xiàn)實(shí)中可能遇到的種種復(fù)雜情況。這種數(shù)據(jù)需求在很多現(xiàn)實(shí)領(lǐng)域中都是無(wú)法實(shí)現(xiàn)的。

  舉例說(shuō)明,比如強(qiáng)化學(xué)習(xí)需要大量的試錯(cuò),如果把單手解魔方機(jī)器手應(yīng)用到做飯的現(xiàn)實(shí)場(chǎng)景,那么它可能會(huì)把食材弄一地,也可能把一整袋鹽倒到鍋中,還有可能引起火災(zāi)。因此通過(guò)試錯(cuò)學(xué)習(xí)的模式,在現(xiàn)實(shí)場(chǎng)景中是無(wú)法實(shí)現(xiàn)的。

  此外,深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)都是機(jī)器學(xué)習(xí)領(lǐng)域中最難調(diào)試成功的,它的成功案例其實(shí)不算很多,但是一旦推出,都會(huì)引起轟動(dòng)。并且,這是一個(gè)連隨機(jī)種子都會(huì)大大影響學(xué)習(xí)效果的模型框架。同樣的模型,訓(xùn)練10次可能7次是失敗的,3次是成功的。還有一點(diǎn),深度強(qiáng)化學(xué)習(xí)極其容易過(guò)擬合到智能體當(dāng)前交互的環(huán)境中,所以環(huán)境稍有改變,之前看起來(lái)表現(xiàn)出色的智能體,很可能就會(huì)犯低級(jí)錯(cuò)誤。

  “人類認(rèn)識(shí)事物的時(shí)候,一般都是通過(guò)數(shù)據(jù)進(jìn)行因果推理和判斷,才得出相應(yīng)的解決方案。而目前的人工智能系統(tǒng)卻并不能實(shí)現(xiàn)這種因果推導(dǎo)?!焙陆I(yè)表示,可能未來(lái)通用人工智能的發(fā)展,還需要依托于腦科學(xué)的發(fā)展,目前我們對(duì)人腦的認(rèn)知還處于非常初級(jí)的階段。大腦對(duì)事物的認(rèn)知過(guò)程、解決問(wèn)題的過(guò)程以及思考的能力等機(jī)制還都不清楚,因此,目前人工智能的發(fā)展,離這種真正能模擬人類智能思考的通用人工智能還有很長(zhǎng)的路要走。

  • 相關(guān)閱讀
  • 中國(guó)科學(xué)家獲得亞洲科學(xué)大獎(jiǎng)

      記者從微尺度物質(zhì)科學(xué)國(guó)家研究中心獲悉,12月6日,日本仁科紀(jì)念基金會(huì)在東京會(huì)館召開(kāi)仁科芳雄獎(jiǎng)項(xiàng)的頒獎(jiǎng)典禮和晚宴,基金會(huì)理事長(zhǎng)、諾貝爾物理學(xué)獎(jiǎng)得主小林誠(chéng)宣布,將2019年度“仁科芳雄亞洲獎(jiǎng)”授予中國(guó)科學(xué)...

    時(shí)間:12-10
  • 應(yīng)用場(chǎng)景勤落地 城市管理更智慧

      作為國(guó)家首批智慧城市試點(diǎn),中新天津生態(tài)城加快實(shí)施“生態(tài)+智慧”雙輪驅(qū)動(dòng)發(fā)展戰(zhàn)略,著力打造生態(tài)城市升級(jí)版和智慧城市創(chuàng)新版。日前,中新天津生態(tài)城華為濱?;赝度脒\(yùn)營(yíng),27個(gè)智能產(chǎn)業(yè)項(xiàng)目“牽手”落戶,將...

    時(shí)間:12-10
  • “鵲橋”又有新動(dòng)作 三根天線探秘宇宙黑暗時(shí)代

      自順利著陸月球背面以來(lái),嫦娥四號(hào)著陸器和玉兔二號(hào)月球車的一舉一動(dòng)都備受關(guān)注。事實(shí)上,我們能得知它們的動(dòng)態(tài),多虧“鵲橋”號(hào)中繼星架起的通信橋梁。   在提供通信中繼服務(wù)的同時(shí),“鵲橋”號(hào)中繼星還肩...

    時(shí)間:12-10
  • “量子壓縮”升級(jí)LIGO 每周都能發(fā)現(xiàn)新引力波

      2015年9月,位于美國(guó)的激光干涉重力波觀測(cè)儀(LIGO)首次探測(cè)到引力波,驗(yàn)證了愛(ài)因斯坦提出的“百年猜想”,人類天文學(xué)開(kāi)啟了“引力波時(shí)代”。   日前,來(lái)自麻省理工學(xué)院、加州理工學(xué)院、澳大利亞國(guó)立大學(xué)...

    時(shí)間:12-10
  • 個(gè)人信息泄露 APP默認(rèn)勾選問(wèn)題最嚴(yán)重

      “數(shù)據(jù)顯示,在受訪者遇到的APP個(gè)人信息保護(hù)問(wèn)題中,最多的是默認(rèn)勾選問(wèn)題,占64.69%?!比涨?,在由南方都市報(bào)大數(shù)據(jù)研究院·南都個(gè)人信息保護(hù)研究中心主辦的“2019啄木鳥(niǎo)數(shù)據(jù)治理論壇”上,南都個(gè)人信息保護(hù)...

    時(shí)間:12-10
  • X射線自由電子激光器可引發(fā)核聚變

      根據(jù)核物理的理論,控制受控核聚變需要高能量。但是,利用X射線的最新自由電子激光器提供的能量和電磁場(chǎng),可以在較低能量下引發(fā)核聚變,德國(guó)德累斯頓—羅森多夫亥姆霍茲中心(HZDR)科學(xué)家在《物理評(píng)論》雜志...

    時(shí)間:12-10
  • “i深圳”區(qū)塊鏈電子證照平臺(tái)上線

      深圳市統(tǒng)一政務(wù)服務(wù)APP“i深圳”區(qū)塊鏈電子證照應(yīng)用平臺(tái)9日正式上線發(fā)布,實(shí)現(xiàn)居民身份證等24類常用電子證照上鏈,在個(gè)人隱私得到最大程度保護(hù)的基礎(chǔ)上,企業(yè)市民攜帶紙質(zhì)證明辦事的不便將大大減少,辦事有望...

    時(shí)間:12-10
  • 打破科技創(chuàng)新體制壁壘

      最近,2019年中國(guó)工程院院士增選結(jié)果揭曉,共產(chǎn)生了75位院士和29位外籍院士。值得關(guān)注的是,本次當(dāng)選的75位院士中,有兩名院士來(lái)自民營(yíng)企業(yè),王堅(jiān)院士更是被稱為“民企院士第一人”。   前不久,科技部公布...

    時(shí)間:12-10
  • 人工智能發(fā)展之路還很長(zhǎng)

      人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量,正在對(duì)經(jīng)濟(jì)發(fā)展、社會(huì)進(jìn)步、國(guó)際政治經(jīng)濟(jì)格局等方面產(chǎn)生重大而深遠(yuǎn)的影響。我國(guó)人工智能發(fā)展起步較晚,要努力在理論、方法、工具、系統(tǒng)等方面取得變革性...

    時(shí)間:12-10
  • 電力數(shù)據(jù)動(dòng)腦 千家萬(wàn)戶受益

      輸入關(guān)鍵詞,電網(wǎng)扶貧、用電情況、上網(wǎng)電量等數(shù)據(jù)一目了然;線路故障、區(qū)域停電可預(yù)測(cè)預(yù)警;實(shí)時(shí)采集“供能—用能”全過(guò)程數(shù)據(jù),為用能企業(yè)建立能耗智慧管理體系,指導(dǎo)企業(yè)能源使用更合理、更經(jīng)濟(jì);為全省30...

    時(shí)間:12-10
免責(zé)聲明:本網(wǎng)對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。 本網(wǎng)站轉(zhuǎn)載圖片、文字之類版權(quán)申明,本網(wǎng)站無(wú)法鑒別所上傳圖片或文字的知識(shí)版權(quán),如果侵犯,請(qǐng)及時(shí)通知我們,本網(wǎng)站將在第一時(shí)間及時(shí)刪除。