Re: 酷

作者: whhsu (ck49th318)   2025-09-09 20:07:44
OpenAI發現評測獎勵猜測,促使大型語言模型出現幻覺
https://www.ithome.com.tw/news/171052
「OpenAI提出的解法著重在改變評測與計分,研究人員建議將主要評測指標
改為同時考量準確、錯誤與棄答,把自信且錯誤的回答視為比棄答更嚴重,
並對恰當的不確定表達給予部分積分」
會不會訓練出內向的 AI 呢? :p

Links booklink

Contact Us: admin [ a t ] ucptt.com