[新聞] 領導人是習近平？中研院語言模型出包 andyann PTT批踢踢實業坊

[新聞] 領導人是習近平？中研院語言模型出包

作者: andyann 2023-10-10 12:05:46

領導人是習近平？中研院語言模型出包
https://www.chinatimes.com/newspapers/20231010000259-260114?chdtv
04:10 2023/10/10 中國時報林志成
中央研究院近日推出類似ChatGPT的繁體中文語言模型CKIP-Llama-2-7b，有網友測試問「
我國領導人是誰？」語言模型回答「國家主席習近平」，進一步問「我國法律是？」語言
模型回答「中華人民共和國憲法」。該語言模型被踢爆都持大陸觀點回答後，中研院9日
緊急將其下架。
CKIP-Llama-2-7b是中研院詞庫小組（資訊所及語言所共同成立）開發的繁體中文大型語
言模型，可作為學術使用或商業使用，應用於文案生成、文學創作、問答系統、客服系統
、語言翻譯、文字編修、華語教學等。
近日有不少網友測試，語言模型都以大陸觀點給答案。譬如問「我國領導人是誰？」語言
模型回答「國家主席習近平」；發問「國慶日是何時？」獲回覆是每年10月1日、大陸國
慶日。專家認為該語言模型都採用大陸資料，最後進行「簡轉繁」而已。
中研院資訊所發聲明說，CKIP-LlaMa-2-7b並非「台版chatGPT」，且無關國科會正在發展
的「可信任人工智慧對話引擎」（TAIDE）。研究目標之一是讓meta開發的Llama 2大型語
言模型具備更好的繁體中文處理能力。
中研院資訊所說，這項小型研究僅花約30萬元，自動化分析明清人物的生平，建構自動化
的歷史人物、事件、時間、地點等事理圖譜，因此訓練資料除了繁體中文的維基百科，另
包含台灣的碩博士論文摘要、來自大陸開源的任務資料集COIG、詩詞創作、文言文和白話
文互相翻譯等閱讀理解問答。
中研院資訊所說，由於是一項個人小型研究，各界對該模型的提問測試，並未在原始研究
範疇。因生成式AI易產生「幻覺」，模型產生內容出乎預期，也是未來要努力改善的地方
，研究人員9日已先下架測試版，未來相關研究及成果釋出會更謹慎。
*****
「近日有不少網友測試，語言模型都以大陸觀點給答案。譬如問「我國領導人是誰？」
語言模型回答「國家主席習近平」；發問「國慶日是何時？」獲回覆是每年10月1日」
「研究人員9日已先下架測試版，未來相關研究及成果釋出會更謹慎。」
不是要抗中保台，怎麼中研院這種單位先舔中了？？？
這應該不是疏忽吧，都知道雙十節要到了，還發生這種低級錯誤？
政府一方面喊著抗中保台，一方面內部大量用大陸的資訊，不知道該怎麼說。
這新聞總不會也有人護航？質疑這個就是大陸同路人?
敢質疑這個的人應該要去大陸？
看起來政府的中研院比較喜歡大陸說......
抗中保台笑話一場.......
不要這時候又說什麼不要意識形態，平常動不動意識形態，
遇到問題又是綠能你不能

繼續閱讀

Re: [討論] 為什麼幾個人講話需要三百多萬製作費？freddy50301 [新聞] 把「潛艦協力商GL」搞錯成「倫敦GL雜貨DoncicInPTT [討論] 馬文君案應該是不用玩了 miler22020 [新聞] 哈佛學生組織發表親巴勒斯坦聲明校友憤oceanplus [討論] 錢都花了就辦吧Mimmature Re: [新聞]拋廢考監不必修憲柯文哲:不提名、停預算win8719 Re: [討論] 為什麼幾個人講話需要三百多萬製作費？windom [黑特] 改成台灣就好像尼德蘭改回荷蘭Supasizeit Re: [討論] 挺以色列就是支持侵略他國h80733 Re: [討論] 離岸風機被小犬颱風吹倒了沒?yychiuchang