橫掃人類棋壇后 AI機器下個目標是征服翻譯
阿爾法狗擊敗柯潔,“勝天半子”的時候大家也都很慌,網(wǎng)上流出很多文章說這狗已經(jīng)聰明到讓人了,太可怕了。
有那么可怕嗎?
目前的人工智能準確地說應(yīng)該叫深度學習,其智能水平還停留在「幼兒」階段。就目前來看,人工智能在規(guī)則固定的棋牌游戲上超越人類無非是因為計算能力的優(yōu)勢,而在身為人基本的語言能力方面,機器還遠遠達不到與人類同場競技的標準。正如你在這周Google DeepMind 的圍棋大會上所看到的,機器學習在最近幾年里已經(jīng)深入滲透到了許多的行業(yè)中。然而在不久之前,對它的討論更多的只是停留在理論層面上,機器學習在生活中的應(yīng)用仿佛還是科幻小說里的事,但現(xiàn)在,我們看到人工智能已經(jīng)成功應(yīng)用于智能汽車,電子游戲、數(shù)字營銷、虛擬助手、聊天機器人和其他我們生活的方方面面。
雖然人工智能已經(jīng)成功攪亂并改善了許多行業(yè),但在它克服一些障礙之前,我們還沒有必要擔心會丟掉我們手上的工作。在今年二月的一次翻譯比賽中,人類打敗了人工智能,但現(xiàn)實一點地說,即時而準確的機器翻譯成為現(xiàn)實也只是時間問題了。
游戲的結(jié)束
1996 年,IBM 的深藍計算機首次挑戰(zhàn)統(tǒng)治國際象棋十二年之久的世界冠軍卡斯帕羅夫,那一次人類贏了。但在 1997 年,深藍成功打敗了卡斯帕羅夫,這次比賽之后,計算機發(fā)展得越來越快,人類再也沒有機會在國際象棋上勝過計算機。下一個淪陷的棋類運動是圍棋。在當時, 這項中國的古老游戲?qū)ψ钕冗M的計算機來說也太過復雜了——據(jù)說圍棋中可能存在的下棋路數(shù)比人類可見的宇宙中存在的原子數(shù)還要多。正因如此,當 DeepMind 的 AlphaGo 人工智能計算機程序在 2016 年 3 月?lián)魯×隧n國的圍棋名將李世石時,整個世界都為之震驚了。
本周,在中國烏鎮(zhèn)舉辦的圍棋峰會上,AlphaGo 已經(jīng)連續(xù)兩局擊敗了世界排名第一的中國棋手柯潔,并于今天下午團滅了五人合作的人類棋手。在去年李世石戰(zhàn)敗后,柯潔曾公開表示自己不可能會輸給這臺冰冷的機器,然而,在見識到 AlphaGo 超乎尋常的成長速度后,柯潔改口稱“人工智能的進步超乎想象”。在后續(xù)的比賽中,AlphaGo 還與人類聯(lián)手對弈,主辦方希望借此探索人工智能除了能夠在人類的游戲中擊敗人類以外,是夠還能夠幫到人類。
征服語言?
現(xiàn)在,行業(yè)的重心已經(jīng)轉(zhuǎn)向了翻譯,語言文字的生產(chǎn)和翻譯在很久以前就是機器學習的一大障礙。早在上個世紀 50 年代,IBM 就已經(jīng)對機器翻譯進行了深入的探索與研究,但直到 90 年代,從 Altavista 的翻譯工具 Babel Fish 開始,這類翻譯工具才進入大眾的視野。然而,機器翻譯也有其自身的限制:機器翻譯只會使用詞典進行字對字的解釋,它可以提供文本的翻譯,卻無法將語義、句法和詞法的復雜性考慮在內(nèi)。
統(tǒng)計機器翻譯(SMT)是翻譯技術(shù)發(fā)展的下一階段。統(tǒng)計機器翻譯的原理是通過一個模型將材料中的單詞和詞組與翻譯過的文章比對(尤其是專業(yè)翻譯),然后挑出最常使用的詞。從邏輯上來說,機器學習和人工智能將能夠掌握語言的復雜性,以往標準的翻譯技術(shù)在這一點上是沒法和深度學習相比的。和人類的大腦一樣,機器需要學習在不同的上下文中使用不同的短語和句子,并隨著時間的推移進一步生成用戶能夠理解并與目標語言相關(guān)的材料。應(yīng)對市場對于精準翻譯的需求,Google 推出了神經(jīng)機器翻譯(NMT)。神經(jīng)機器翻譯技術(shù)在翻譯文本時讓機器更關(guān)注整個句子而不是其中的一些成分(單詞、詞組等),通過把這些成分用最自然的方式組合起來,從而得出最佳的翻譯結(jié)果。
當人工智能技術(shù)應(yīng)用到這個過程中時,神經(jīng)機器翻譯就可以從其他已完成的翻譯中分析學習它們的結(jié)構(gòu),學習它們在語序等細微問題上如何做出調(diào)整。
還差得遠呢
考慮到現(xiàn)在技術(shù)進步的驚人速度,一些靠語言和翻譯吃飯的人才開始擔心神經(jīng)機器翻譯會搶了他們的飯碗也就不足為奇了。但從另一個角度來看,全世界仍有許許多多的人和企業(yè)對科技打破語言的障礙、人工智能成為全新的通用語言還是充滿期待的。因此,當世宗大學與韓國國際翻譯協(xié)會合作,組織人類譯員與 Google 全新的神經(jīng)機器翻譯系統(tǒng)(以及韓國本地搜索引擎 Naver 的翻譯工具)進行翻譯比賽時,人類的感覺是既激動又恐慌的,尤其對譯員們來說,這場比賽可能會預告著他們的工作不再有保障了。
這場比賽耗時 50 分鐘,比賽雙方需要翻譯兩份隨機選擇的未經(jīng)翻譯過的文本,一份為文學翻譯,一份非文學性質(zhì)。比賽的結(jié)果還是比較讓人安心的,無論是韓翻英還是英翻韓,無論是文學性翻譯還是非文學文本翻譯,人類都以較大的優(yōu)勢打敗了基于人工智能的機器翻譯。
也有很多人認為,不同于數(shù)學或者棋類游戲,翻譯沒有一個客觀的標準,而最終比賽判定結(jié)果的又是人類的評審,所以這其中可能會有不好定奪的主觀成分存在。但是,考慮到評委在判斷時只是根據(jù)翻譯結(jié)果是否符合母語使用者的語言習慣,以及是否有明顯的語法錯誤來判定輸贏,所以這次比賽的判決應(yīng)該還是非常公正的。評委們表示,神經(jīng)機器翻譯系統(tǒng)翻譯出的文字有 90% 都有語法上的錯誤,這些錯誤不明顯,但足以讓受過教育的英語母語或韓語母語者感到尷尬。這次人與機器的對抗結(jié)束后,許多語言學家和翻譯人員都可以松一口氣了。但不可避免的是,隨著神經(jīng)機器翻譯系統(tǒng)的進一步發(fā)展,技術(shù)性的內(nèi)容,那些有著嚴格標準和術(shù)語使用規(guī)范的內(nèi)容,可能更容易被機器完美地翻譯出來,并且不需要太多后期的人工編輯。
然而,文學和營銷方面的文本在翻譯時就幾乎是需要就目標市場和受眾的情況進行再創(chuàng)作,這對于人工智能機器翻譯而言,毫無疑問仍然是一個艱難的挑戰(zhàn)。翻譯這種內(nèi)容需要基于一定的語境和研究,同時也要有一定創(chuàng)作的能力來與目標讀者取得共鳴。
在翻譯和語言學的世界里,機器想要取代人類,還有很長很長的路要走。
中研網(wǎng)是中國領(lǐng)先的綜合經(jīng)濟門戶,聚焦產(chǎn)業(yè)、科技、創(chuàng)新等研究領(lǐng)域,致力于為中高端人士提供最具權(quán)威性的產(chǎn)業(yè)資訊。每天對全球產(chǎn)業(yè)經(jīng)濟新聞進行及時追蹤報道,并對熱點行業(yè)專題探討及深入評析。以獨到的專業(yè)視角,全力打造中國權(quán)威的經(jīng)濟研究、決策支持平臺!
廣告、內(nèi)容合作請點這里:
尋求報道 ??相關(guān)閱讀
【版權(quán)及免責聲明】凡注明"轉(zhuǎn)載來源"的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多的信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。中研網(wǎng)倡導尊重與保護知識產(chǎn)權(quán),如發(fā)現(xiàn)本站文章存在內(nèi)容、版權(quán)或其它問題,
煩請聯(lián)系:jsb@chinairn.com、0755-23619058,我們將及時溝通與處理。
精彩推薦
圖片資訊
行業(yè)研究院
中國園藝用品行業(yè)供需市場調(diào)研分析及投資戰(zhàn)略研究
園藝用品研究報告對園藝用品行業(yè)研究的內(nèi)容和方法進行全
中國航空鍛件市場深度全景調(diào)研及“十三五”發(fā)展前景預測
航空鍛件行業(yè)研究報告中的航空鍛件行業(yè)數(shù)據(jù)分析以權(quán)威的
金融機具行業(yè)研究報告旨在從國家經(jīng)濟和產(chǎn)業(yè)發(fā)展的戰(zhàn)略入