国产日本一区二区三区四区五区|最近高清中文在线国语视频|奷小罗莉在线观看国产|亚洲av无码乱码在线观看富二代|欧美人交a欧美精品v一区|亚洲一区二区久久|亚洲一二三区电影久久久

国产日本一区二区三区四区五区|最近高清中文在线国语视频|奷小罗莉在线观看国产|亚洲av无码乱码在线观看富二代|欧美人交a欧美精品v一区|亚洲一区二区久久|亚洲一二三区电影久久久

手機看中經(jīng)經(jīng)濟日報微信中經(jīng)網(wǎng)微信

科學(xué)現場(chǎng):人工智能讀書(shū)“破萬(wàn)卷” 難答“小兒科”

2018年01月24日 09:06   來(lái)源:中國青年報   

  科學(xué)現場(chǎng)

  人工智能:讀書(shū)“破萬(wàn)卷”,難答“小兒科”

  閱讀來(lái)自維基百科的536篇文章,回答10萬(wàn)個(gè)基于文章內容的問(wèn)題,除了題量大一點(diǎn),這場(chǎng)比賽挺像大學(xué)英語(yǔ)六級考試的閱讀理解測試。

  但你不可能聽(tīng)到考場(chǎng)里奮筆疾書(shū)的“唰唰”聲,因為“參賽者”只是一段代碼。輸入文章和問(wèn)題后,計算機的中央處理器(CPU)和圖形處理器(GPU)開(kāi)始高速計算,最后交出答卷,由出題者批閱。

  對來(lái)自世界各國的研究者來(lái)說(shuō),這是一場(chǎng)沒(méi)有盡頭的競賽——任何人可以在任意時(shí)間加入,排行榜實(shí)時(shí)更新;即使是第一名,不保持“學(xué)習”和“更新”,隨時(shí)有可能被新加入者超越。它可能發(fā)生在你吃飯和睡覺(jué)的時(shí)候,而“對手”不過(guò)是“啪啪啪”地敲擊了一串代碼。

  這場(chǎng)競賽全稱(chēng)SQuAD(Stanford Question Answering Dataset)文本理解挑戰賽,由斯坦福大學(xué)在2016年9月發(fā)起,是業(yè)內公認的機器閱讀理解標準水平測試,也是這個(gè)領(lǐng)域的頂級賽事。

  在2018年1月3日以前,人類(lèi)始終保持著(zhù)領(lǐng)先的優(yōu)勢——從來(lái)沒(méi)有任何一個(gè)團隊能夠設計出一種答題正確率超過(guò)人類(lèi)的算法。這一天,微軟亞洲研究院自然語(yǔ)言計算組提交的新模型獲得了82.650的精確匹配分數,超過(guò)了人類(lèi)得分82.304。僅過(guò)了兩天,阿里巴巴iDST-NLP團隊也拿到了82.440的精確匹配分數。

  微軟亞洲研究院院長(cháng)洪小文告訴中國青年報·中青在線(xiàn)記者:“這對微軟和自然語(yǔ)言處理(NLP)研究領(lǐng)域來(lái)說(shuō),都是一個(gè)重要的里程碑。計算機文本理解能力首次超越人類(lèi),預示著(zhù)該領(lǐng)域的研究將會(huì )有更大突破!

  在計算機看來(lái),世間萬(wàn)物都是一串數字

  微軟亞洲研究院副院長(cháng)、自然語(yǔ)言計算組負責人周明博士坐在計算機前,緊張地等待測試結果。經(jīng)過(guò)1個(gè)多月對模型和算法的更新,他們提交了最新代碼。

  這支團隊在SQuAD挑戰賽初期,一度以穩定的成績(jì)長(cháng)期位居排行榜榜首,但周明知道,這場(chǎng)競賽的排名瞬息萬(wàn)變。2017年最后兩個(gè)月里,科大訊飛與哈工大聯(lián)合實(shí)驗室、騰訊DPDAC NLP團隊先后超過(guò)了他們。

  新選手參賽大約兩三分鐘后,系統就完成了約50篇數百詞的文章閱讀和約1萬(wàn)個(gè)問(wèn)題的回答。即使母語(yǔ)是英語(yǔ)的成年人,這個(gè)時(shí)間也才勉強讀完5篇文章。

  “對人類(lèi)來(lái)說(shuō),讀完一篇文章就會(huì )在腦海中形成一定的印象,比如這篇文章講的什么人,發(fā)生了什么故事。人們能夠輕而易舉地歸納出文章里的重點(diǎn)內容,但對計算機來(lái)說(shuō)不是這樣!敝苊鞲嬖V中國青年報·中青在線(xiàn)記者。

  在SQuAD測試中,計算機需要閱讀一段材料,然后回答諸如人名、地理位置等問(wèn)題。不同于類(lèi)似測試,SQuAD測試的回答可能是一段短語(yǔ),而非某個(gè)單詞或單個(gè)內容。它可能遭遇同義詞替換、句子結構變換等情況,甚至需要綜合多個(gè)句子進(jìn)行邏輯推理。

  為了解決這個(gè)問(wèn)題,研究組模擬人類(lèi)做閱讀理解過(guò)程的方式,他們將整個(gè)過(guò)程分成了四步。拿到測試題后,計算機首先會(huì )學(xué)習文本和問(wèn)題,就像我們做閱讀題時(shí),首先會(huì )通讀文章,然后審題,獲得一個(gè)整體印象。

  下一步,計算機會(huì )將問(wèn)題和文章進(jìn)行比對,找出相關(guān)段落,就像人類(lèi)定位關(guān)鍵信息的環(huán)節。接下來(lái),計算機會(huì )把初步結果放到上下文里比對,類(lèi)似人會(huì )綜合全文看待問(wèn)題。最后,它會(huì )斟酌并選出最像答案的內容。

  在這場(chǎng)競賽中,不同團隊設計的答題模式可能完全不同。周明介紹說(shuō),他們的設計中,最獨特的就是第3步,是通過(guò)“注意力機制”達到的。這讓關(guān)鍵信息像被畫(huà)上了重點(diǎn)一樣,成為計算機眼中高亮的部分。

  “除了自然語(yǔ)言處理,注意力機制在圖像識別領(lǐng)域也是關(guān)鍵的概念!泵绹鐐惐葋喆髮W(xué)計算機系碩士生何欽堯告訴中國青年報·中青在線(xiàn)記者。

  人類(lèi)視覺(jué)能夠通過(guò)快速掃描整體圖像后,找到需要重點(diǎn)關(guān)注的區域,并投入更多注意力,以獲得更多細節,抑制其他無(wú)用信息。研究者也嘗試讓計算機學(xué)習并利用這種機制。不同于人類(lèi)擁有動(dòng)植物、山川河流的概念,所有單詞和圖像在計算機看來(lái)都是一串數字。它必須從數字背后微妙的聯(lián)系中,洞悉它們的意義。

  真理隱藏在數據和概率里

  周明所在團隊使用的計算機并不是憑空學(xué)會(huì )做題。參加SQuAD競賽前,它就像“學(xué)霸”考前刷題一樣,先看過(guò)了約500篇文章和與之對應的10萬(wàn)道題目、答案。

  但周明表示,“目前基于深度學(xué)習的機器閱讀理解模型都是黑盒的狀態(tài),很難直觀(guān)地表示機器進(jìn)行閱讀理解的過(guò)程和結果。未來(lái),可解釋性的深度學(xué)習模型值得進(jìn)一步探究!

  通過(guò)大量學(xué)習,計算機明白了什么數字意味著(zhù)與文章內容相關(guān),怎樣的聯(lián)系意味著(zhù)這就是問(wèn)題的答案。

  “真理就隱藏在數據和概率里,我們這個(gè)領(lǐng)域的研究者大多都這么看!焙螝J堯說(shuō)。一個(gè)1歲人類(lèi)孩童看過(guò)狗以后,就能識別各種體型、品種和不同拍攝角度的狗,形成概念,但計算機需要看過(guò)很多照片后,才能判斷某個(gè)物體是不是狗!拔覀儾恢廊祟(lèi)是怎么形成這個(gè)概念的,但對計算機來(lái)說(shuō),概念是靠積累數據、靠計算概率得來(lái)的!

  直到20世紀90年代之前,人們還在試圖讓計算機學(xué)會(huì )人類(lèi)語(yǔ)言的規則,從而理解背后的含義。但語(yǔ)言在使用時(shí)往往不規范,機器無(wú)法處理偏離規則的內容。后來(lái),人們開(kāi)始讓機器自己進(jìn)行學(xué)習,獲取語(yǔ)言知識。

  發(fā)展到今天,自然語(yǔ)言處理領(lǐng)域的研究已經(jīng)基本可以應付單個(gè)句子,理解句子成分。各大手機廠(chǎng)商也推出了自己的人工智能語(yǔ)音系統,可以識別并完成用戶(hù)的指令,還能進(jìn)行簡(jiǎn)單的交流和對話(huà)。

  “長(cháng)文本的理解一直是難點(diǎn),這涉及句子之間的連貫性、上下文銜接和邏輯推理等更高難度的內容!敝苊髡f(shuō)。

  當我們告訴計算機,“萊茵河上最大的城市是德國科隆,它是中歐和西歐區域的第二長(cháng)河流,位于多瑙河之后”,并問(wèn)它“什么河比萊茵河長(cháng)”時(shí),很多計算機會(huì )回答“科隆”。

  如何理解代詞“它”、理解“位于……之后”表示比較而非物理上的前后,成為這些“選手”很大的障礙。人類(lèi)擁有“科隆是城市而非河流”這種常識,幾乎不會(huì )在這個(gè)問(wèn)題上犯錯,但計算機無(wú)法理解這個(gè)概念。

  SQuAD競賽不是第一個(gè)計算機“超越”人類(lèi)的領(lǐng)域

  計算機很早就在計算、記憶的領(lǐng)域碾軋人類(lèi),后來(lái)又擊敗了人類(lèi)最優(yōu)秀的國際象棋、圍棋棋手。

  “其實(shí),計算、下棋、機器翻譯等只聚焦單一任務(wù)本身的人工智能都屬于弱人工智能,”周明說(shuō),“不過(guò)弱人工智能并不弱,它可以具備超越人類(lèi)的某些能力,有很大的價(jià)值,但是弱人工智能還無(wú)法真正理解它接收到的信息,而這就使得通往強人工智能的道路十分艱難!

  60多年前,曾有人嘗試讓計算機用6條規則和200個(gè)詞匯做俄英翻譯,這被認為是最早的人工智能?chē)L試。那時(shí)的研究人員信心滿(mǎn)滿(mǎn),宣稱(chēng)能在5年內完全解決一種語(yǔ)言到另一種語(yǔ)言的自動(dòng)翻譯問(wèn)題。

  這個(gè)目標至今沒(méi)有完成,人工智能也因為研究進(jìn)展緩慢經(jīng)歷過(guò)兩次低潮。一直到近10年,計算機性能的大幅度提升和機器學(xué)習理論的興起讓人工智能再次熱了起來(lái)。人們發(fā)現,計算機能夠寫(xiě)詩(shī)詞、與人對話(huà),它變得越來(lái)越像人。

  據統計,21世紀以來(lái)新創(chuàng )辦的人工智能企業(yè)中,有近三分之二是在5年內創(chuàng )辦的。最近3年,人工智能領(lǐng)域的就業(yè)崗位數量飆升近8倍。在亞洲,過(guò)去17年內投向人工智能領(lǐng)域的51億美元中,有95%是在過(guò)去5年內投入的。

  翻看SQuAD競賽排行榜,前3名都是來(lái)自中國的團隊!斑@在過(guò)去是不敢想象的!敝苊髡f(shuō)。放在20年前,中國甚至還沒(méi)有在這個(gè)領(lǐng)域的頂級會(huì )議上發(fā)表過(guò)文章。而現在,中國發(fā)表的文章數已經(jīng)穩居世界第二,2017年還有5篇文章入選該會(huì )議的22篇杰出論文。

  在SQuAD競賽中,計算機得分比人類(lèi)高0.346分,可以理解為同樣做1萬(wàn)道題時(shí),計算機多做對35道!斑@遠不代表計算機超越了人類(lèi)的閱讀理解水平!敝苊鞲嬖V中國青年報·中青在線(xiàn)記者。也有人質(zhì)疑,這里代表“人類(lèi)”的,不過(guò)是眾包平臺上一小時(shí)掙9美元、受教育水平參差不齊的人。

  一個(gè)公認的人工智能的標準是能夠通過(guò)“圖靈測試”——如果一臺機器能夠與人進(jìn)行交流,并且被人誤以為是人,那它就具有智能。

  “ ‘能理解、會(huì )思考’,這其中,理解自然語(yǔ)言是最核心的問(wèn)題!敝苊髡f(shuō)。目前,計算機還是很難在日常交流中理解雙關(guān)和諷刺。在中文語(yǔ)境下,計算機還需要面對如何將一個(gè)句子拆分為數個(gè)詞匯的問(wèn)題。很多對人類(lèi)而言無(wú)需學(xué)習的事情,例如保持平衡、用手拿起一個(gè)杯子,對機器而言也是無(wú)比困難的事情。

  機器沒(méi)有經(jīng)過(guò)幾億年的演化,也沒(méi)有人類(lèi)大腦里由神經(jīng)元數百萬(wàn)次電脈沖轉化成的觸覺(jué)、聽(tīng)覺(jué)或是視覺(jué)。在人類(lèi)程序員的馴導下,它把一切轉化為數字。

  時(shí)至今日,谷歌仍然在特意審查“大猩猩”詞條的搜索結果,避免圖像搜索引擎把它和黑種人的圖像混淆。了解識別特性的工程師可以通過(guò)肉眼無(wú)法識別的微調,讓計算機把小狗圖片當成鴕鳥(niǎo),或是將一片馬賽克認成獵豹。有時(shí),把中文翻譯成英文再翻譯回來(lái),整句話(huà)都變得面目全非。

  在人工智能威脅論不絕于耳的今天,周明幾乎沒(méi)有擔心,他向中國青年報·中青在線(xiàn)記者舉了SQuAD競賽中的一個(gè)例子。

  機器閱讀了“按質(zhì)量算,氧氣是宇宙中第三多的元素,排在氫和氦之后”,面對“什么是第二多的元素”的問(wèn)題,它的回答卻是“氧”。不管是微軟還是阿里巴巴團隊設計的算法,都不能解決這個(gè)再簡(jiǎn)單不過(guò)的問(wèn)題。

  這不只是人工智能之間的競賽,也是人類(lèi)和自己的競賽。

  中國青年報·中青在線(xiàn)見(jiàn)習記者 王嘉興 來(lái)源:中國青年報 ( 2018年01月24日 11 版)

(責任編輯:何欣)

91人人妻人人澡人人爽国产网址| 宝贝腿开大一点你真湿H| 爱情岛论坛自拍亚洲品质极速福利| 亚欧成a人无码精品va片| 中文字幕一区二区三区乱码图片| 一区二区三区鲁丝不卡| 国产狂喷潮在线观看| 亚洲成a人蜜臀AV在线播放| 一本久道久久综合婷婷| 国产成人高清精品亚洲| 日韩欧美一区二区三区四区五区| 亚洲av动漫日韩卡通欧美| 国产精品无码素人福利不卡| 中文国产精品久久久| A级无遮挡超级高清-在线观看| 久久国产亚洲精品无码| 精品毛片完整版视频| 国产69精品久久久久观看软件| 在线观看人成视频| 无码久久精品人妻一区二区三区| 最新在线中文字幕| 国产精品免费久久久久软件| 亚洲美女另类一区| 亚洲va久久久噜噜噜久久熟女| 亚欧乱色国产精品九库| 国产麻豆精品一区| 中国女人美女一级毛片| 亚洲精品综合第一| 亚洲av成人无网码天堂| 日韩欧美国产一区二区在线观看| 精品久久久久中文字幕一区| 国产精品亚洲日韩欧美色窝窝色欲| 波多野结衣一区二区| 91午夜精品亚洲一区二区三区| 国产模特酒店私拍福利视频| jvid亚洲精品无圣光图套| 日本不卡免费新一二三区| 又大又粗的黑黑的东西| 中文无码aV一区二区三区| 99久久精品国产亚洲av热热爱| 亚洲av无码一区二区三区dv| 欧美日中文字幕| 国产亚洲综合一区二区| 日韩一级视频在线观看播放| 国产成人综合精品无码| 日韩欧美群交P内射捆绑| 国产自产v一区二区三区c| 又粗又黄又猛又爽大片免费| 亚洲欧美中文日韩国产大秀| 伊人久久亚洲综合网| 久久免费在线观看中文字幕| 韩日午夜在线资源一区二区| 亚洲无线观看国产精品| 精品一级少妇久久久久久久| A级国产乱理伦片免费观看| 一女被两男吃奶玩乳尖小说| 亚洲香蕉AV在线一区二区三区| 中文国产精品久久久| 亚洲Av无码第一区二区三区| 免费在线观看最新高清电影| 蜜臀av一区二区三区久久| 亚洲系列中文字幕一区二区| 综合国产免费自拍| 成年无码av片| HEYZO无码综合国产精品| 亚洲精品亚洲人成在线观看| 四虎精品免费永久免费视频| 婷婷五月天综合在线视频| 一级毛片黄久久久免费看A片| 日本高清有码中文字幕视频| 国产精品精品国产色婷婷| 国产精品福利一区二区久久| 国产一区二区精品久久久久| 亚洲AV无码精品无码麻豆| 狠狠做五月深爱婷婷| 国产精品福利一区二区在线观看| 在线观看免费国产视频| 国产精品香蕉一区二区三区| 人人爽人人爽人人片AV免费| 国产真实乱子伦精品视手机观看| 国产va饥渴难耐女保洁员| 亚洲一区在线观看免费| 日韩一本一道一区2区电影视频| 亚洲综合五月天激动情网| 久久国产免费观看视频| 欧美一级大片在线观看| 制服丝袜视频一区中文学幕| 亚州欧美日韩精品一区二区| 无遮挡18禁啪啪羞羞漫画| japanese在线播放国产| 伊人久久无码中文字幕网| 欧美一区二区三区视频| 国产一级黄色大片无码| 免费在线观看高清完整版| 精品成年片在线观看| 免费无码AV一区二区三区| 浪货趴办公桌-H揉弄一根手指紧| 吉吉av电影| 伊人久久大香线蕉亚洲五月天色| 成人经典1级在线1区2区3区| 国产免费一区二区三区在线观看| 日本漫画全彩汉化漫画大全| 推油少妇久久99久久99久久| 国产成人精品久久| 人妻wwwav一区二区| 玉足打脚枪榨精小h文| 69SEX久久精品国产麻豆| 日韩一区二区三区不卡中文字幕| 91精品国产91次久久次福制| 成人A级毛片免费视频| 国内精品久久久久久久| 国产成人精品高清在线观看99| 国产精品久久亚洲一区二区| 一级日本精品视频在线观看一起| 亚洲永久免费视频网站| 亚洲AV无码成H人动漫无遮挡| 国产爆乳无码视频在线观看| 亚洲美女图片一区二区三区动漫| 亚洲一级av不卡毛片无码| 中文字幕乱码人妻无码久久激情| 99热在线观看| 中文字幕乱码一区av久久| 产精品无码久久_亚洲国产精| 亚洲aV无码aV吞精久久| 久久精品国产久精国产果冻传媒| 尤妮丝三点尽露| 中文字幕+乱码+中文ktv| 欧美日韩大片一区二区三区| 日本大码a∨欧美在线| 日本成本人片免费网站| 亚洲免费av一区二区三区| 一区二区三区内射美女毛片| 日本三级欧美三级| 亚洲AV无码专区一区二区天堂| 国产午夜精品一区二区三区小说| 成人午夜精品久久久精品| 五月婷婷丁香在线| 亚洲人成亚洲精品| 中文字幕日韩在线视频| 国产性色av免费观看在线| 国内熟妇不卡一区二区| 日本三级韩国三级欧美三级| 日本aⅴ亚洲精品中文乱码| 亚洲欧美国产日韩制服bt| 精品无码av无码专区| 亚洲成av人片在线观看无码| 免费在线观看最新高清电影| 婷婷五月天综合在线视频| 成人片黄网站色大片免费| 午夜一级毛片| 日韩视频在线一区二区| 亚洲成人一区二区三区| 国产精品久久久久久无人区| 国产黑色丝袜在线观看片不卡顿| 精品一区二区三区免费电影| 欧美喷潮久久久XXXXX| 黄品汇mba智库官网下载| 日本一区免费看| 国产成人夜色福利高潮一区二区| 亚洲综合欧美日韩一二区| 扒开她的腿屁股直流白色液体| 成人精品视频一区二区三区| 免费国语手机免费观看| 中国性xxx免费视频|