[新聞] DeepSeek R2震撼來襲：低成本高效能AI模 Roger5566 PTT批踢踢實業坊

[新聞] DeepSeek R2震撼來襲：低成本高效能AI模

作者: Roger5566 (我難過) 2025-04-28 16:31:33

原文標題：DeepSeek R2震撼來襲：低成本高效能AI模型或再度引發美股慘烈震盪
原文連結：https://news.cnyes.com/news/id/5952677
發布時間：2025-04-28 15:10
記者署名：鉅亨網編譯莊閔棻
原文內容：
中國人工智慧（AI）公司 DeepSeek 似乎即將再度在市場上投下震撼彈。隨著 DeepSeek
即將發布的 R2 AI 模型細節再度流出，市場對該模型的關注再次掀起波瀾，並可能又對
美國股市，尤其是科技股，造成衝擊。
據報導，雖然目前 DeepSeek 尚未正式公布 R2 的具體規格，但中國媒體引述消息指出，
R2 將採用升級版的專家混合（Hybrid MoE）架構，並可能結合先進的（gating
mechanisms）與 Dense 層（dense layers）設計，專為優化高負載運算。新模型的參數
量預計將達到驚人的 1.2 兆，是 R1 的兩倍。
根據爆料，DeepSeek R2 在每個字元（token）的單位成本上，比 GPT-4 暴降了 97.4%，
輸入（input）每百萬個字元只要 0.07 美元，輸出（output）每百萬個字元則只要
0.27 美元。與 OpenAI 目前的收費標準相比，R2 將成為企業市場上極具吸引力的高效能
、低成本選擇。
這樣的成本優勢，無疑將對美國 AI 公司造成嚴重衝擊。市場分析指出，若 DeepSeek
R2 真如預期般強勢推出，將使 OpenAI 等企業面臨前所未有的競爭壓力，進而影響美股
科技類股的表現。
值得一提的是，DeepSeek R2 不僅在參數規模和成本上實現突破，還在硬體層面實現了自
家技術的深度整合。DeepSeek 選擇全程依賴華為 Ascend 910B 晶片群進行訓練，把華
為 Ascend 910B 晶片群利用率推到了 82%，FP16 精度算力實測達到 512PetaFLOPS，接
近同規模輝達 A100 群 91% 的性能。
資料還顯示，DeepSeek R2 的訓練資料量高達 5.2PB，並在多項測試中表現出色。特別是
在 C-Eval2.0 中文語言測試中，R2 達到了 89.7% 的優異成績；在 COCO 資料集上，R2
的電腦視覺能力也達到了 92.4%，顯示其不僅在語言處理方面有顯著突破，也在視覺識別
領域有了長足進展。
除了在參數規模和成本上取得突破，DeepSeek R2 還在模型部署方面創新。報導稱，R2
可在 8bit 量化壓縮模式下將模型體積縮小至 83%，同時精度損失控制在 2% 以內，大大
提升 AI 模型在終端設備上的部署可能性，為未來的 AI 應用開啟了新的大門。
DeepSeek R2 的發布或將成為科技股的重大挑戰。DeepSeek R1 曾經讓美國股市遭遇慘痛
損失，尤其是對輝達等 AI 晶片製造商造成巨大打擊，市值一度蒸發 6000 億美元。隨
著 R2 的消息逐步流出，美股投資者開始擔心中國 AI 企業再次在市場上掀起新的風暴。
心得/評論：
DS上次發布後，納指兩天跌了約4%，港股開始上漲一波約20%
這次主要升級部分是用華為晶片，不再用輝達H800等晶片，
受衝擊的可能就是輝達，美股目前沒啥反映，
性能就算升級一些也在預期之中，影響一定不如R1那樣0到1的突破衝擊
R2整體AI效能就等發布後評測的結果，
手中有美股的還是要小心點主力結合關稅議題趁機到貨

作者: junior020486 (軟蛋頭) 2025-04-28 16:58:00

偷買多少H100?

作者: shomingchang ( ) 2025-04-28 17:11:00

不開源要怎麼有學術用途？

作者: fantasyscure (台灣狼) 2025-04-28 17:14:00

算力不夠還在那邊縮減硬體 AI競爭到放假消息大家都減少支出不買跟廠商壓價錢再一次買大量

作者: madeinheaven 2025-04-28 17:25:00

DeepSeek早就被看破手腳了

作者: howhow801122 (傑哥) 2025-04-28 18:25:00

教主的NV......

作者: s56565566123 (OnlyRumble) 2025-04-28 19:14:00

崩崩爽全面樂觀就是崩