Re: [問卦] deepseek 到底是不是抄的 風向好亂

作者: a46911a149 (a149)   2025-01-30 09:55:31
Deepseek AI的訓練過程確實有用到蒸餾技術
蒸餾技術,就是在前人製造AI(例如chatgpt)的基礎上,
拿別人AI的回答當作訓練自己AI的材料
這種作法雖然有點像抄襲他人AI的能力,但在學術界已經是行之有年的做法
各國很多頂尖實驗室都用過這種方法訓練自己的AI
chatgpt之前也不反對別人拿它的AI的api回答來訓練模型
總體來說 deepseek的訓練過程其實沒什麼不光彩的地方,
但確實也不必過分神話deepseek
deepseek 在訓練方法與架構上確實有自己的突破與學術貢獻在
這方面很值得讚賞
但它也有不少承襲前人的地方,也參考了美國其他機構的開源AI模型
它並不是自己閉門造車,更像是在前人的成果上進一步向上突破
如果沒有openai以及其他美國公司機構作為ai的前沿探索
deepseek大概也不太可能無中生有自己生出來
所以抱持客觀態度看待即可
不用過分貶低deepseek,但也不必太過輕視openai等美國企業
此外Deepseek願意分享自己的成果,將自己開源分享自己的模型,
公開自己的技術與模型參數,這也是讓人讚賞的
這也是歐美網路上不少人對deepseek有正面評價的原因
這代表每個人都可以免費下載deepseek的原始參數程式
自己復現並改造一個私人版本的deepseek ai,也能參考它的技術挪為己用
所以審查只是枝微末節
因為每個人大可以免費下載一個不需要聯網的AI模型
在自己的機器上改掉審查的部分以供自己使用

Links booklink

Contact Us: admin [ a t ] ucptt.com