作者:Will Knight
機(jī)器之心翻譯 參與:李九喻、微胖
Maluuba正在訓(xùn)練深度學(xué)習(xí)算法,回答少量文本問題。該技術(shù)最終可能會替代人類閱讀用戶使用手冊。
教計(jì)算機(jī)以超人的水平下圍棋很酷,但是,對你和我來說沒多大用處。不過,如果有一臺電腦能讀懂幾十頁的文本,例如新微波爐的使用手冊,然后回答關(guān)于它如何操作的問題,會怎樣?給我來一臺。
閱讀和理解文本對計(jì)算機(jī)來說非常困難,但加拿大一家名叫Maluuba的公司已經(jīng)利用一種算法在這方面取得進(jìn)展,該算法可以閱讀文本并以令人印象深刻的準(zhǔn)確度回答相關(guān)問題。最重要的是,不像其他的方法,它只需要少量文本就可以運(yùn)行,可能最終幫助電腦理解文檔。
Mauuba的研究人員上周發(fā)布了論文,描述他們最新的進(jìn)展。它描述了一個(gè)能夠閱讀幾百個(gè)童話故事的算法,并提問和回答文本相關(guān)問題。在訓(xùn)練結(jié)束后,該算法可以正確地回答有關(guān)其并不熟悉文本的多選題,準(zhǔn)確率超過70%。研究人員還用《哈利波特和魔法石》測試了它,發(fā)現(xiàn)該算法可以用類似的準(zhǔn)確率回答有關(guān)文本的問題。
除了學(xué)術(shù)上的進(jìn)步,Maluuba希望最終創(chuàng)建一個(gè)可以幫你完成繁瑣閱讀的系統(tǒng)。總部設(shè)在加拿大滑鐵盧的公司產(chǎn)品副總裁表示Muhamed Musbah表示:「我們有興趣的使用案例包括用戶使用手冊,患者記錄,或者客戶服務(wù)文件。在這些領(lǐng)域,真的沒有過剩的數(shù)據(jù)。」
Maluuba的研究小組利用被稱為深度學(xué)習(xí)的流行神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法培養(yǎng)自己的系統(tǒng)。但是,研究人員設(shè)計(jì)他們的網(wǎng)絡(luò)來考慮不同抽象程度的文本—— 從詞詞到短語到句子——而且他們也讓網(wǎng)絡(luò)在訓(xùn)練之前,就為善于用這種方法進(jìn)行學(xué)習(xí)做準(zhǔn)備。通常,深度學(xué)習(xí)網(wǎng)絡(luò)在訓(xùn)練前受到隨機(jī)配置。這使網(wǎng)絡(luò)學(xué)習(xí)得很快,結(jié)果,問答表現(xiàn)上,比使用深度學(xué)習(xí)方法前提高15%。它也比最好的人工編碼解決方案好2%。
蒙特利爾大學(xué)教授兼Maluuba的科學(xué)顧問Yoshua Bengio說: 「從數(shù)字上看,這是一個(gè)大的飛躍。」但是,目前為努力商業(yè)化人工智能的公司工作、深度學(xué)習(xí)為數(shù)不多的大師之一Bengio也警告說,專家還需要一段時(shí)間解析該方法的意義。
教會機(jī)器閱讀和使用語言進(jìn)行有效交流的想法肯定是誘人的。它可以開發(fā)出強(qiáng)大的新方式來與計(jì)算機(jī)互動(dòng)以及挖掘信息。但是,理解文本是人工智能面臨的最大挑戰(zhàn)之一;計(jì)算機(jī)通常被這一事實(shí)絆住: [理解] 語言需要對現(xiàn)實(shí)世界運(yùn)方式有深刻理解。
盡管面臨這些挑戰(zhàn),一些最大的科技公司正試圖開發(fā)可以理解文本的人工智能。Facebook正在通過叫做M的助理服務(wù)收集交談數(shù)據(jù),用來訓(xùn)練能夠自然交談的算法。谷歌的DeepMind正在做類似的工作,訓(xùn)練深度學(xué)習(xí)系統(tǒng)閱讀新聞?wù)?/div>
然而迄今為止,還沒有出現(xiàn)過巨大突破,也不清楚給機(jī)器配備成熟的閱讀理解能力會有多困難。通過調(diào)整和完善關(guān)鍵的機(jī)器學(xué)習(xí)技巧以及向電腦輸入大量注釋文本,研究人員正在取得巨大進(jìn)展。為了能夠?qū)W習(xí),Maluuba研究人員使用的這種機(jī)器學(xué)習(xí)方法通常需要巨大的文本。實(shí)際上,讓深度學(xué)習(xí)運(yùn)行的文本量,通常被視為主要限制因素之一。一個(gè)基本的語言挑戰(zhàn)是,被用來表示不同概念的單詞是任意的,所以,較之圖片,更難得出語言之間的聯(lián)系。
由滑鐵盧大學(xué)的幾個(gè)畢業(yè)生在2010年創(chuàng)立的Maluuba,先前開發(fā)過智能手機(jī)的智能個(gè)人助理,而且已經(jīng)將研究重點(diǎn)置于自然語言處理或機(jī)器理解方面。
同樣致力于語言處理,人工智能公司MetaMind的聯(lián)合創(chuàng)始人Richard Socher說:「我認(rèn)為,它是向前的一步,這是一個(gè)工程設(shè)計(jì)極佳的系統(tǒng),將已被充分理解、確定的傳統(tǒng)自然語言處理特征和來自神經(jīng)網(wǎng)絡(luò)想法結(jié)合了起來。」
來自卡內(nèi)基·梅隆大學(xué),專門從事自然語言處理的研究人員Chris Dyer,也認(rèn)為Maluuba的研究成果令人印象深刻,但是,他相信機(jī)器需要獲得對世界的真正理解才能正常交談,而不是從文本得出統(tǒng)計(jì)結(jié)論。這將意味著要超越純粹對注釋文本的學(xué)習(xí)。
Dyer說:「就計(jì)算機(jī)對世界的感知和理解而言,它太有限了。」
本文由機(jī)器之心編譯
|