[新聞] 用中文跟Google助理自然聊天 研究員:

作者: rhino0314 (鬼島夢想家)   2018-05-13 21:38:42
用中文跟Google助理自然聊天 研究員:還得再等等
Google從語音輸入、搜尋開始,到語音助理Google Assistant已發展多時,今年Google
I/O開發者大會上更宣布將支援超過30國語言、在80個國家服務,同時也由Google執行長
皮采(Sundar Pichai)展示新功能「Duplex」,像是為用戶撥打電話訂餐廳、預約剪髮
等,如同人類般的聊天功力及節奏是這次Google Assistant的亮點之一,不過,在功能越
發強大的同時,還是得問「那中文呢?」,目前看來要做到與Google Assistant自然的聊
天還是沒辦法。
專攻自然語音處理(Natural Language Processing,讓電腦更懂人類語言)的Google研
究員宋雲軒,與台灣媒體分享中文對Google Assistant帶來的挑戰。宋雲軒表示,語音辨
識技術發展已近30年,Google很強調自然語言(口語)處理,而要讓Google Assistant組
織起語言,需先辨讀大量的聲音及語言資訊,自然地以中文與它聊天之所以難,或對自然
語言翻譯最具挑戰的地方是斷詞斷句、詞彙順序及語調。
第一,沒有明顯的「斷詞」,比如:我們在野生動物園玩,可以有「我們 在 野生 動物
園 玩」及「我們 在野 生動 物園 玩」兩種辨讀,另外,不同標點符號的位置也會有不
同意思,畢竟我們在講話不會特別說出標點符號,但聲音訊號在給AI分析後,還需要特別
做出斷句(Sentence Segmentation)。
前後文改動順序也會有不同意思,拿Google翻譯來說「他昨天睡很晚
He woke up late yesterday」就與「他昨天很晚睡He went to bed late yesterday」,
在來是語調,普通話有4種語調(4聲)、而廣東則有9種,像是「我要睡覺」跟「我要水
餃」對AI來說就有辨識上的難度,更別說是方言與腔調了。
宋雲軒指出,Google近來投入深度學習及神經網路的應用,由工程師寫出深度學習的模組
,以訓練分析中文沒有很嚴謹的句子結構,不過,利用深度學習已經大有改善(有別於將
每個句子轉為數字、深度學習能夠直接對聲音進行處理),句子辨識的錯誤率降低了
15~20%。
至於何時才能跟Google Assistant聊天、或使用到Duplex的技術,宋雲軒表示進展還無法
透露,而在韓語Google Assistant推出後,也讓人擔心中文的發展進度,會不會是因為「
資料庫不足」造成開發緩慢,宋雲軒表示這並非最大因素。目前中文Google Assistant可
以做到語音搜尋、但還不能聊天,Command不等於Search,畢竟Search只是將你句子的重
要詞彙抓出來丟到資料庫搜尋而已,Google Assistant要能與你進行自然語言的交流,首
先還是得完整了解你的需求,對於「世界最難語言」之一的中文,Google還是有段長路要
走。(廖家葆/舊金山報導)
https://tw.appledaily.com/new/realtime/20180511/1351674/
作者: kuninaka   2018-05-13 21:40:00
鹿港腔OK嗎
作者: Superxixai (洪粉吱已)   2018-05-13 21:41:00
海口腔可以嗎
作者: orangeon11 (11)   2018-05-13 21:43:00
療色嗎
作者: XOXOXOXO (阿良)   2018-05-13 21:45:00
可以讓肥宅練習虧妹嗎
作者: jetaime851 (jetaime)   2018-05-13 21:47:00
我男

Links booklink

Contact Us: admin [ a t ] ucptt.com