[新聞] DeepSeek 公布最新V3模型　意圖超越 Open jeff0025 PTT批踢踢實業坊

[新聞] DeepSeek 公布最新V3模型　意圖超越 Open

作者: jeff0025 2025-03-25 16:18:20

ETtoday新聞雲 2025年03月25日 16:10
DeepSeek 公布最新V3模型　意圖超越 OpenAI
DeepSeek 昨日（24）針對其「DeepSeek V3-0324」模型悄悄發布了更新，雖非外界預期
的R2 模型，但仍然有不少亮點。
V3模型無預警地在本週的 Hugging Face 上發布，此次更新聲稱能夠「有效且準確地解決
現實世界中的挑戰」。今年一月，DeepSeek 一度超越 ChatGPT，成為蘋果美國應用程式
商店中最受歡迎的免費軟體。V3 模型是一款強大的混合專家（MoE）語言模型，擁有
6710 億個總參數，其中處理每個 token（即每個單詞或符號）時，模型會動態選擇並啟
動370億個參數來進行計算，這種方法使得模型能夠在保持高效運行的同時，利用大量參
數來提高預測的準確性和性能。在預訓練之後，V3 進行了知識蒸餾，從 DeepSeek-R1 模
型中提取知識，這一過程進一步提升了模型的性能和應用能力。
本次更新展示了 DeepSeek 在技術創新方面的持續努力，並預示著未來 AI 技術將更加高
效。隨著競爭的加劇，DeepSeek 的進步無疑將對全球 AI 產業產生深遠影響，更突顯了
這家中國 AI 新創公司保持領先競爭對手的意圖。
https://www.ettoday.net/news/20250325/2931329.htm
穩了?
昨天DeepSeek更新V3模型雖然非預期的R2模型
V3擁有6710億個參數處理單詞或符號模型會動態啟動370億個參數計算
V3使用知識蒸餾從DeepSeek R1提取知識提升模型的性能和應用能力

作者: kuojames2580 (幹幹幹幹幹) 2025-03-25 16:22:00

中國或許發明打不贏美國但一定能捲贏美國

作者: cityhunter04 (無聊的乖小孩 ) 2025-03-25 16:27:00

越公布越虛弱…還要吹多久呢？

作者: drpepperfish 2025-03-25 16:31:00

心得除了「穩了」之外都是節錄文章內容，覺得你進桶比較穩

作者: hamasaki7788 (jeffery) 2025-03-25 16:37:00

隨便了啦

作者: zombiepigman 2025-03-25 16:40:00

煩死了什麼都要卷

作者: junior020486 (軟蛋頭) 2025-03-25 16:49:00

好了啦，你偷買多少Blackwell系列的伺服器新加坡偷賣多少啦不bang新加坡，中國一直偷買一直爽Ban啦幹笑死，沒站上？前一陣子回到140叫做DS問世以後沒站上，你活在平行世界噢XD中期回檔一個多月就一堆散戶在那邊：啊～算力過剩

作者: ts0045851127 (cing) 2025-03-25 17:09:00

中國ai不敢信

作者: ken123321987 (溺水者) 2025-03-25 17:42:00

各位偉大的中國人打倒美帝就在眼前革命尚未成功同志仍須努力中國爸爸不會忘記彎彎的

作者: wahaha711233 2025-03-26 10:01:00

26捲起來，消費者舒服，米國佬吃屎

繼續閱讀

[新聞] DeepSeek 公布最新V3模型 意圖超越 Open

[新聞] DeepSeek 公布最新V3模型　意圖超越 Open