告诉大模型“深呼吸”能大幅提升数学得分 involution PTT批踢踢實業坊

告诉大模型“深呼吸”能大幅提升数学得分

作者: involution (內卷是好文明) 2023-09-21 16:34:22

告诉大模型“深呼吸”能大幅提升数学得分
https://www.solidot.org/story?sid=76142
Google DeepMind 的研究人员在预印本平台 arXiv 发表论文《Large Language Models
as Optimizers》，介绍了大模型的一种优化方法：用一个大模型修饰提示，改进另一个
大模型的数学能力。初步结果显示，使用“深呼吸，一步步解决问题”的提示效果最为显
著，能大幅提升数学测试得分。对 Google 的 PaLM 2 大模型使用该提示，它在小学数学
应用题数据集 GSM8K 中的正确率达到了 80.2%，而不使用该提示正确率只有 34%，“让
我们一步步思考”提示的正确率为 71.8%。为什么会有如此惊人的变化？大模型显然不会
呼吸，也不像人类那样思考和推理。它们所做的推理都源自从书籍和互联网上抓取的短语
数据集。其中包括问答形式的论坛，此类论坛包含了大量“深呼吸”，“一步步思考”等
短语，后面紧跟着更细致入微的推理方案。这些短语可能有助于大模型产生更好的答案。
https://arstechnica.com/?p=1969012
https://arxiv.org/pdf/2309.03409.pdf

繼續閱讀

Re: 高雄知名熱炒店爆食物中毒！情侶血便難排尿ErL0715 [姆咪] 我跟鐵道成女的距離cities516 [姆咪] 出去吃好了a5WaGyu [閒聊] 看到JK的胖次了cloud654 Re: 真有50歲阿伯氣到把咒術丟進垃圾桶medama 為啥現在還是那麼熱啊ErL0715 高雄知名熱炒店爆食物中毒！情侶血便難排尿medama [鐵道] : 米哈遊不是腦袋破洞就是逼課deathslipkno 有推薦的漫畫ㄇErL0715 [閒聊] 戀物和其他性癖好an94mod0