[新聞] 阿里發布新開源模型 家用顯卡就能跑

作者: nisi0773 (再會了 曾有的夢想生活)   2025-03-06 21:01:52
原文標題:DeepSeek有勁敵!阿里發布新開源模型 家用顯卡就能跑
原文連結:https://udn.com/news/story/7333/8590256?from=udn-catebreaknews_ch2
發布時間:2025-03-06 14:25
記者署名:聯合報/ 記者陳湘瑾
原文內容:
阿里巴巴AI To C業務旗下AI應用「阿里通義」在6日正式發布最新的開源推理模型通義千
問QwQ-32B,其官方介紹稱,透過大規模強化學習,千問QwQ-32B在數學、代碼及通用能力
上進步飛躍,整體性能比肩DeepSeek-R1,同時大幅降低部署使用成本,在消費級顯卡上
能實現本地部署。
使用者已可免費下載及商用QwQ-32B模型,或透過網頁版Qwen Chat體驗,該模型也將免費
上架通義App。
阿里通義團隊表示,QwQ-32B模型針對數學和編程任務、通用能力分別進行2輪大規模強化
學習,在32B的模型尺寸上獲得推理能力提升,印證了大規模強化學習(Reinforcement
Learning,一種機器學習技術)可顯著提高模型性能。
該團隊指,千問QwQ-32B能提供極強的推理能力,以及滿足更低的資源消耗需求,背後關
鍵在於強化學習。該團隊表示,希望能夠證明強大的基礎模型疊加大規模強化學習,也許
是一條通往通用人工智能(AGI)的可行之路。
此外,QwQ-32B模型中還集成了與智能體(AI Agent,指的是能夠自主做出決策、完成行
動,且毋需人類介入的人工智慧)相關的能力,能在使用工具的同時進行批判性思考,以
及根據環境回饋調整推理過程。
受此消息影響,6日阿里巴巴集團港股早盤大幅高開漲逾6%,截至午盤漲逾7%。
心得/評論:
原來今天阿里巴巴是在漲這個
看來DS確實帶動了AI走出了不同的局面與蓬勃發展
同時也帶動了港股與其他科技類股不小的漲幅
00753跟00752今天也幾乎要收復去年十月開始的跌幅了
作者: cuteSquirrel (松鼠)   2025-03-06 21:02:00
40大盜
作者: noirskakashi (楊安安)   2025-03-06 21:19:00
QwQ
作者: lolpklol0975 (鬼邢)   2025-03-06 21:40:00
CUDA一座城池 攻破難, 繞過去就好
作者: s56565566123 (OnlyRumble)   2025-03-07 08:42:00
大家都在笑中國的時候 噴啦

Links booklink

Contact Us: admin [ a t ] ucptt.com