[新聞]DeepSeek-R1 模型升級新版本，推理能力接 pl132 PTT批踢踢實業坊

[新聞]DeepSeek-R1 模型升級新版本，推理能力接

作者: pl132 (pl132) 2025-05-30 15:47:33

DeepSeek-R1 模型升級新版本，推理能力接近 o3、Gemini 2.5 Pro
https://tinyurl.com/2bkshvbp
中國 DeepSeek（深度求索）釋出 DeepSeek-R1-0528 模型新版本，使其免費開源模型在
推理能力能與 OpenAI o3、Google Gemini 2.5 Pro 等付費專有模型並駕齊驅。
DeepSeek-R1-0528 以 2024 年 12 月發表的 DeepSeek-V3-Base 為基礎，在後訓練（
Post-Training）過程投入更多算力，提升新版模型思考深度與推理能力，有助於提升數
學、科學、商業及程式設計等複雜推理任務上的表現。
DeepSeek-R1-0528 在數學、程式設計及通用邏輯等多個基準測試取得優異成績，並在整
體表現上接近如 OpenAI o3、Google Gemini 2.5 Pro。
相較於舊版 DeepSeek-R1，新版模型在複雜推理任務的表現有所提升。例如 AIME 2025
測試，因推理過程中加強思考深度，新版模型準確率由舊版的 70% 提升至 87.5%。
同時，DeepSeek 蒸餾 DeepSeek-R1-0528 的 CoT（Chain of Thought）後訓練
Qwen3-8B Base，得到了 DeepSeek-R1-0528-Qwen3-8B。這款 8B 模型在數學測驗 AIME
2024 僅次於 DeepSeek-R1-0528、超越 Qwen3-8B，並與 Qwen3-235B 相當。DeepSeek 認
為，DeepSeek-R1-0528 的 CoT 對於學術界推理模型的研究和工業界針對小模型的發展皆
具意義。
https://is.gd/b5sIbD
與先前版本相同，DeepSeek-R1-0528 採用 MIT 授權條款，並上傳至開源機器學習社群平
台 Hugging Face，開發者能夠自由修改甚至進行商業部署。

繼續閱讀

Re: [討論] 於新竹市起家的薪資gnemail183 [討論] 浮動式的端午獎金yokann [情報] 聯電調薪開獎 (Dcard)yokann Re: [討論] 於新竹市起家的薪資tobashi Re: [情報] D卡：量化交易薪水分享joywilliamjo [新聞] 揭秘台灣輝達供應鏈最神秘未上市散熱公司penny83320 [心得] 我在資策會受訓的心路歷程 - Part 1qweqwe [情報] D卡：量化交易薪水分享Vanced [情報]興大-免費職訓- AI智慧製造與感測物聯網 tatina927 [新聞] 傳英偉達將為中國推出性能降級版AI芯片createlight