Re: [問卦] deepseek 到底是不是抄的風向好亂 a46911a149 PTT批踢踢實業坊

Re: [問卦] deepseek 到底是不是抄的風向好亂

作者: a46911a149 (a149) 2025-01-30 09:55:31

Deepseek AI的訓練過程確實有用到蒸餾技術
蒸餾技術，就是在前人製造AI(例如chatgpt)的基礎上，
拿別人AI的回答當作訓練自己AI的材料
這種作法雖然有點像抄襲他人AI的能力，但在學術界已經是行之有年的做法
各國很多頂尖實驗室都用過這種方法訓練自己的AI
chatgpt之前也不反對別人拿它的AI的api回答來訓練模型
總體來說 deepseek的訓練過程其實沒什麼不光彩的地方，
但確實也不必過分神話deepseek
deepseek 在訓練方法與架構上確實有自己的突破與學術貢獻在
這方面很值得讚賞
但它也有不少承襲前人的地方，也參考了美國其他機構的開源AI模型
它並不是自己閉門造車，更像是在前人的成果上進一步向上突破
如果沒有openai以及其他美國公司機構作為ai的前沿探索
deepseek大概也不太可能無中生有自己生出來
所以抱持客觀態度看待即可
不用過分貶低deepseek，但也不必太過輕視openai等美國企業
此外Deepseek願意分享自己的成果，將自己開源分享自己的模型，
公開自己的技術與模型參數，這也是讓人讚賞的
這也是歐美網路上不少人對deepseek有正面評價的原因
這代表每個人都可以免費下載deepseek的原始參數程式
自己復現並改造一個私人版本的deepseek ai，也能參考它的技術挪為己用
所以審查只是枝微末節
因為每個人大可以免費下載一個不需要聯網的AI模型
在自己的機器上改掉審查的部分以供自己使用

繼續閱讀

Re: [問卦] deepseek這回答到底嗑了多少？Azimech Re: [問卦] deepseek這回答到底嗑了多少？leocean9816 [問卦] 貓食放地上就吃貓貓是餓壞了嗎？jerry0505 Re: [問卦] 為何從不檢討每間廟去年國運籤準不準？dj720c Re: [問卦] DeepSeek怎麼一天就走下神壇?mjh [問卦] deepseek的天才少女不出來救場嗎？indium111 [問卦] 今天小診所看病掛號費要600？xz4979265 Re: [新聞] OpenAI：已掌握DeepSeek盜用模型證據cloud72426 Re: [問卦] 為啥餐飲二代都不忍手藝失傳放棄高薪？YU0121 Re: [問卦] 醫師、律師、會計師，哪個最好考nowitzkixd

Re: [問卦] deepseek 到底是不是抄的 風向好亂

Re: [問卦] deepseek 到底是不是抄的風向好亂