5/16/2018 2:47:00 PM
翻譯行業(yè)的大舉動(dòng),或?qū)?shí)現(xiàn)實(shí)時(shí)語(yǔ)音翻譯
對(duì)著類似小型手機(jī)的翻譯機(jī)說(shuō)話,翻譯機(jī)話筒里就會(huì)發(fā)出提前設(shè)置好的另一種語(yǔ)言的聲音。新華社深圳4月26日電 (記者 王豐)科幻電影《銀河系漫游指南》中,有一種神奇的巴別魚,寄生在主人耳朵里,能自動(dòng)將周圍人群的腦電波轉(zhuǎn)換成寄主那種類型的腦電波,于是寄主就能聽懂任何一種人類語(yǔ)言了。
現(xiàn)在,全世界的語(yǔ)音人工智能科學(xué)家都在嘗試復(fù)制巴別魚,用金屬、芯片和復(fù)雜的程序語(yǔ)言來(lái)實(shí)現(xiàn)“實(shí)時(shí)語(yǔ)音翻譯”,以期未來(lái)能夠取代人工同聲傳譯,而中國(guó)科學(xué)家們也在進(jìn)行著積極探索。
日前在深圳舉辦的第六屆中國(guó)電子信息博覽會(huì)上,中國(guó)人工智能公司科大訊飛展示了最新款的巴別魚產(chǎn)品——訊飛翻譯機(jī)2.0,這款手持翻譯機(jī)不僅支持中文與全球33種語(yǔ)言即時(shí)互譯,還支持粵語(yǔ)、四川話、河南話、東北話四種方言口音的識(shí)別及中英文離線翻譯。對(duì)著類似小型手機(jī)的翻譯機(jī)說(shuō)話,翻譯機(jī)話筒里就會(huì)發(fā)出另一種語(yǔ)言的聲音。
科大訊飛執(zhí)行總裁胡郁介紹,自上世紀(jì)40年代計(jì)算機(jī)誕生之日起,科學(xué)家們就開始嘗試機(jī)器翻譯。但是由于語(yǔ)言的復(fù)雜性和靈活性,雖然經(jīng)過(guò)了70多年的發(fā)展,機(jī)器翻譯的質(zhì)量與人們的期望仍有相當(dāng)大的差距。
“基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯的出現(xiàn),讓機(jī)器翻譯有了跨越式的進(jìn)步?!焙粽f(shuō),“如何能夠提供更流暢、聽起來(lái)更有‘人味’的翻譯,進(jìn)而能夠取代人工同傳,這是我們的最終目標(biāo)。”訊飛翻譯機(jī)2.0不僅支持中文與全球33種語(yǔ)言即時(shí)互譯,還支持粵語(yǔ)、四川話、河南話、東北話四種方言口音的識(shí)別以及中英文離線翻譯。
2014年9月,神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯技術(shù)被提出,期望讓機(jī)器模擬人腦神經(jīng)系統(tǒng)。神經(jīng)網(wǎng)絡(luò)的一個(gè)重要特性是“從環(huán)境中學(xué)習(xí)”?;诖?,神經(jīng)網(wǎng)絡(luò)翻譯試圖通過(guò)對(duì)人腦的基本單元——神經(jīng)元的建模和聯(lián)結(jié),探索建立模擬人腦神經(jīng)系統(tǒng)功能的神經(jīng)網(wǎng)絡(luò),使機(jī)器具有學(xué)習(xí)、聯(lián)想、記憶和模式識(shí)別等智能信息處理功能。
胡郁介紹,有了人工神經(jīng)網(wǎng)絡(luò),機(jī)器在翻譯的過(guò)程中就會(huì)先分析和評(píng)估句子的特征,再以這些特征作為中介進(jìn)行翻譯。如此,翻譯自然更為流暢準(zhǔn)確。訊飛翻譯機(jī)2.0的應(yīng)用場(chǎng)景
谷歌、微軟及中國(guó)的科大訊飛、百度、騰訊等公司都已搭建了自己的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯系統(tǒng)。
“神經(jīng)網(wǎng)絡(luò)翻譯模型在模型結(jié)構(gòu)上模擬了人腦,其中參數(shù)的優(yōu)化過(guò)程類似人的學(xué)習(xí)過(guò)程?!焙粽f(shuō)。
2017年的百度世界大會(huì)上,百度宣布機(jī)器翻譯系統(tǒng)在大學(xué)英語(yǔ)六級(jí)翻譯考試中得到13.6分(滿分15分),而目前訊飛翻譯機(jī)2.0的翻譯準(zhǔn)確率也達(dá)到了95%以上。這對(duì)于復(fù)制真正的巴別魚還只是開始。
胡郁說(shuō),剩下的5%的問(wèn)題可能是很致命的,“攻克這5%所花費(fèi)的代價(jià)往往要比攻克95%大得多?!痹谏钲谂e行的第六屆中國(guó)電子信息博覽會(huì)上,科大訊飛展示自家研發(fā)的翻譯機(jī)。
科大訊飛機(jī)器翻譯研究主管劉俊華說(shuō),雖然目前機(jī)器對(duì)單個(gè)句子的翻譯可以實(shí)現(xiàn)流暢和自然,但是在整個(gè)篇章的上下文理解方面,機(jī)器翻譯并不給力。一旦涉及歇后語(yǔ)、詩(shī)句、雙關(guān)語(yǔ)甚至口語(yǔ)化的表達(dá),機(jī)器翻譯更會(huì)掉鏈子。而對(duì)于如何將知識(shí)融合到機(jī)器翻譯系統(tǒng)中,讓機(jī)器真正“理解”人類的語(yǔ)言,目前還沒(méi)有較好的解決方案。
“如何掌握復(fù)雜、多變的‘人性’,或許才是復(fù)制一條真正巴別魚的關(guān)鍵?!焙粽f(shuō)。