[新聞] Google對話式AI有望支援台語 盼攜手本土學者

作者: CCY0927 (只是個暱稱罷了)   2023-08-16 22:57:23
https://www.cna.com.tw/news/ait/202308160338.aspx
Google對話式AI有望支援台語 盼攜手本土學者
2023/8/16 20:17(8/16 22:16 更新)
https://i.imgur.com/2R9XKiu.png
Google傑出科學家紀懷新目前在Google總部DeepMind團隊,帶領大型語言模型研究與對話
式人工智慧(AI)Bard開發。他16日出席媒體聚會,分享Google針對大型語言模型技術研
究與應用的發展概況。中央社記者吳家豪攝 112年8月16日
(中央社記者吳家豪台北16日電)Google對話式人工智慧(AI)服務Bard今年7月擴大支
援包含繁體中文在內的40種語言,Google今天表示,Bard未來有機會支援台語,但台語屬
於低資源語言,較難蒐集相關數據,Google有意願與台灣本土學者合作克服困難。
Google今天由傑出科學家(Distinguished Scientist)紀懷新出席媒體聚會,分享
Google針對大型語言模型技術研究與應用的發展概況。紀懷新來自台灣、目前在總部
Google DeepMind團隊,帶領大型語言模型(LLM)研究與Bard開發工作。
他說,大型語言模型的發展變革仍在早期階段,它會大幅改變人們與AI互動的方式,為生
活帶來顯著改變。Google發表Bard,並非因為已經是完整的產品,Bard更像是實驗性質的
產品,Google希望了解用戶對它的期望。
中央社記者提問,未來Bard是否有機會支援台語、客語等台灣本土語言;紀懷新回應,在
自然語言學術研究上,數據蒐集是相當困難的問題,尤其是低資源語言(low-resource
languages),連Google這麼大的公司,想蒐集相關資料都很困難。
紀懷新說,在全球不同地區,可能已經有當地學者在蒐集當地語言相關資料,如果Google
自行蒐集數據,品質不見得比當地學者更好。台灣學術機構例如中央研究院,對本土語言
的研究相當重視,Google有意願與台灣學者合作,克服相關困難。
紀懷新提到,台灣人才以往較注重硬體製造,1980、1990年代很多人才到國外學習新技術
帶回台灣,奠定台灣製造業在國際的領先地位。
他說,Google目前策略是兼顧硬體和軟體,台灣在AI和機器學習的發展上具有很大潛力,
現在是好時機走向新局面,包括台語和客語研究都是Google與台灣學者可以合作的機會。
談到這次回台灣想做的事,紀懷新笑說,自己大約一年沒回來,希望多吃一點台灣美食、
與Google台灣員工交流。他看好台灣在AI方面有發展潛力,希望能花一些時間為台灣做出
貢獻。
從2013年起,紀懷新帶領的團隊為YouTube、Google新聞、廣告、Google Play商店等產品
,帶來超過720項改進。他著名的研究領域為網路和線上社群系統對使用者行為的影響,
並擁有39項專利和200多篇研究論文發表。(編輯:張良知)1120816
作者: medama ( )   2023-08-17 00:11:00
fb之前也有支援
作者: MilchFlasche (實踐才能發光)   2023-08-17 08:57:00
FB那個後來有實際開放使用嗎XD(當然是樂觀其成)回應原文,投入資金和人力的話低資源語言也可很快變高資源語言啊。期待共享和合作了。
作者: Tahuiyuan (mata)   2023-08-18 08:21:00
不期不待,高機率變成廈門話版本。Google真那麼有本事,就不會拿中國資料庫當作Google翻譯中文版標準資料,正確做法是以信、雅、達且較複雜的台灣繁體及用語為準,由繁馭簡,才能兼顧繁簡。
作者: medama ( )   2023-08-18 08:56:00
廈門話語料沒有台灣多吧fb之前的閩南語翻譯版也是以台灣腔閩南語為主
作者: MilchFlasche (實踐才能發光)   2023-08-18 13:55:00
我做過幾年的l10n in-house,我知影Google濫著zh-cn有可能是想欲省錢,閣嘛可能是主持者本成著毋是臺灣出身个
作者: gmkuo (嗯嗯)   2023-08-18 14:14:00
干焦水餃餡橐個束個捎落去烏白攪包包咧,毋知的人攏講好食GIGO
作者: saram (saram)   2023-08-18 20:54:00
振奮人心好消息.
作者: MilchFlasche (實踐才能發光)   2023-08-20 08:03:00
因為人家已經聊開到Google翻譯去了,當然不只關於語音資料。看別人在談什麼也看完整一點好嗎
作者: saram (saram)   2023-08-20 19:43:00
我要的不只是翻譯字詞.要得是能輸入語言為字詞,也要按照輸入麥克風語音或串流音檔而翻成台文.就像中文的語音處理一樣.你是地下爬的蟲我則是天上飛的鷹.
作者: sodabubble (石の上にも三年)   2023-08-20 21:47:00
你要「輸入麥克風語音」,你還打錯字。要「的」是,連字都打不正確、選不正確的人……
作者: saram (saram)   2023-08-21 01:25:00
字與音是兩個層次,但在最終(以線上翻譯而言)兩樣會一起呈現如果完全不用漢字,以標音符號為字面也無礙於語音的判讀.換言之語音詞庫的索引只是一個內碼而已.先要建立所有台語詞的音檔庫.它怎麼寫(圖形檔)都不重要.接電話時我們聽到熟悉的語音就明白,不必再看文字.呈現的漢字就算你不滿意,或根本是台羅字都無所謂.
作者: MilchFlasche (實踐才能發光)   2023-08-21 07:37:00
繼續紮稻草人好為人師啊。
作者: Tahuiyuan (mata)   2023-08-21 09:58:00
講啥…只要有了台語的優勢語音,以IPA形式建檔到足以提供TTS服務,再參考人類語言的同位異音模型,就可以建立台語的初版語音輸入法,再參考使用者的語音升級到能辨認各種腔調、口音或不標準發音,語音輸入一般都是這樣建立起來的。

Links booklink

Contact Us: admin [ a t ] ucptt.com