[討論] AGI 評鑑/預測 AmosYang PTT批踢踢實業坊

[討論] AGI 評鑑/預測

作者: AmosYang (泛用人型編碼器) 2025-07-04 11:56:47

對 AGI (Artificial General Intelligence) 的進展有興趣的話可以看看
https://arcprize.org/ 這個 AGI 評鑑系統，尤其是試玩一下它的 2025 年版的
ARG-AGI-2 題目 ( https://arcprize.org/play )，
* 看看你覺得這樣的題目對人腦來說的難易度
* 看看你覺得「符號解讀、組合推理、上下文規則應用」是否為 AGI 的必要條件
* 看看你覺得這些題組是否能有效測量「符號解讀、組合推理、上下文規則應用」
然後參考以下數據 ( https://arcprize.org/leaderboard )：
* 人腦最高分是 100%, 每個工作項目成本 $17
* 最高分的 AI (Claude Opus 4) 得分 8.6%, 每個工作項目成本 $1.93
* 次高分的 AI (ChatGPT o3) 得分 6.5%, 每個工作項目成本 $0.834
* 「純 LLM」 AI 最高分數 1.3%
2019~2024 年使用的 ARC-AGI-1 題目， AI 最高得分是約 75% 。
另一個可以參考的網站是 https://theagiclock.com/ ，預測 AGI 到來的時間
(以及解釋它預測的根據); 可以 3~6 個月後來看看 AGI 的進展是線性、指數
，還是卡關。

作者: jamesho8743 (加拿大好美) 2025-07-04 12:24:00

有意思的網站謝分享

作者: attacksoil (擊壤) 2025-07-04 12:36:00

有趣

作者: haudoing (阿華平凡版) 2025-07-07 16:43:00

還蠻好玩的我還沒輸XD

作者: KAOKAOKAO (鬼斗) 2025-07-09 08:54:00

本以為是抬槓文內容是有料資訊建議標題擴充

作者: CoNsTaR ((const *)) 2025-08-02 14:34:00

最近有一篇論文用一個 27M （對，27M 不是 27b) parameters 的 recurrent network 沒有 pre-training，訓練只用了1000 steps 就達到 40%

繼續閱讀