Re: [閒聊] AI翻譯484比機翻順?

作者: tsubasawolfy (悠久の翼)   2023-07-29 19:57:05
: 大意就是顧及語言和文化的差異無法直譯
: 它就直接用另一個語言寫新故事
: 總之AI是會以可讀性為優先 自己再創作或加油添醋的
: 跟機翻那種逐字逐句對照可以方便校閱或學習單字是完全兩種概念
這比較像ChatGPT的翻譯跟上一世代的機器翻譯的世代差異
chatgpt使用的是兩種語言之間的機率相似度去重組,換言之你可以把它看作
它知道兩種語言的...本質? 然後透過本質去轉換後輸出。
直接用這個影片內的圖解釋
https://youtu.be/hph9OeKjg3w?si=rIi1yUkjZfgM_W4j
這部影片是在講能不能用ChatGPT能不能讓我們跟鯨魚對話
裡面有提到上一世代的機器翻譯(已經用了機器學習的翻譯機)
https://i.imgur.com/LNph0hM.png
兩種語言的翻譯需要一個編碼器跟解碼器
左邊的編碼器先把This dog is black轉換成對應向量(數值)
https://i.imgur.com/pJVUfyX.png
然後再把這些數值經過法語的解碼器轉換成相對應的法語 (逐字逐句翻)
https://i.imgur.com/M2wNu3Y.png
https://i.imgur.com/aJNMJ0c.png
但是這種方法需要你已經了解另一個語言後,才能做出相對應的解碼器
就像羅塞塔石碑那樣,別人已經幫你刻好相對應的語言轉換在上面
如果要拿來翻譯鯨語是不可能的,所以它們才想用ChatGPT的方式
chatgpt一樣是各語言都拆解編碼轉換成數值,依照出現頻率跟相對應機率做出文字雲
https://i.imgur.com/Fs5WjjN.png
https://i.imgur.com/2JgWkBj.png
然後把這些文字雲疊在一起,找出兩種語言高度重疊區域,再進行A語言轉換成B語言
當然轉換輸出的語言也要根據該語言的遊戲規則(對GPT來說是排列組合不同)去輸出
https://i.imgur.com/pByVDWZ.png
https://i.imgur.com/o38Zib7.png
我覺得這種找出語言之間高度相似處轉換,就有點像找出那句話的本質??
例如 桌上有一顆蘋果 代表你說的就是桌子上有一顆蘋果在那邊的這個情境or事實
然後把這個事實用不同語言描述一次,而不是傳統的點對點的逐句機器翻譯
但是這種方式就是需要大量的語言文字去搞出那個 文字銀河系 (不是雲等級)
回到那個影片
所以想要用這種方式去翻譯抹香鯨鯨語是有可能,多虧冷戰已經收集了很多年的海底聲音
但是但是這是各種鯨魚的資料,還要先過濾出各種鯨魚的叫聲才有可能建立
抹香鯨自己的鯨語銀河系去翻譯成人類語言
作者: LawLawDer (肉肉的)   2023-07-29 20:03:00
好屌…
作者: Wardyal (Wardyal)   2023-07-29 20:05:00
你鯨魚語言的Dataset沒正確的Label怎麼訓練所以靠出現機率就能得出意思嗎
作者: reader2714 (無毀的湖光)   2023-07-29 20:06:00
好像也有要把dna編碼當作語言去翻譯的研究
作者: labbat (labbat)   2023-07-29 20:13:00
無label就unsupervised唄
作者: smart0eddie (smart0eddie)   2023-07-29 20:18:00
人跟鯨魚的認知會一樣嗎
作者: cloki (夜雲天)   2023-07-29 20:36:00
就不管認知一不一樣直接用實際存在的頻率數據去練吧先把那些東西分群然後再進一步訓練去提高準確率
作者: longlongint (華哥爾)   2023-07-29 21:17:00
可以做出能跟鯨魚對話的AI 但人還是不懂只好把小孩送進去一起從小學鯨魚雨
作者: smart0eddie (smart0eddie)   2023-07-29 21:28:00
認知不一樣你兩群就不一樣啊

Links booklink

Contact Us: admin [ a t ] ucptt.com