Progressive-Hint Prompting Improves Reasoning in Large Language Models

这篇具有很好参考价值的文章主要介绍了Progressive-Hint Prompting Improves Reasoning in Large Language Models。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

本文是LLM系列的文章,针对《Progressive-Hint Prompting Improves Reasoning
in Large Language Models》的翻译。

摘要

大型语言模型(LLM)在推理任务中的性能在很大程度上取决于提示设计,思想链(CoT)和自洽性是增强这种能力的关键方法。然而,这些方法并没有充分利用LLM生成的答案来指导后续响应。本文提出了一种新的提示方法,称为渐进提示(PHP),通过使用以前生成的答案作为提示,逐步引导用户找到正确的答案,实现用户和LLM之间的自动多次交互。PHP与CoT和自一致性正交,因此可以轻松地与最先进的技术相结合,以进一步提高性能。我们在七个基准上进行了广泛而全面的实验。结果表明,PHP在保持高效的同时显著提高了准确性。例如,使用text-davinci-003,我们观察到与复杂CoT相比,贪婪解码的GSM8K改进了4.2%,自一致性的样本路径减少了46.17%。通过GPT-4和PHP,我们在SVAMP上实现了最先进的性能(89.1%→ 91.9%)、GSM8K(92%→ 95.5%)、AQuA(76.4%→ 79.9%)和数学(50.3%)→ 53.9%)。

1 引言

2 相关工作

3 渐进提示Prompting

4 实验

5 结论

6 实现细节

7 不足与未来工作

8 广泛的影响

9 具有不同提示的模型响应

具有不同提示的模型响应。当呈现提示100时,该模型准确地解决了该问题。相反,如果提供的提示与正确答案偏离太远,则模型可能会被误导。例如,当提示为0时,模型计算出未使用的胡萝卜量为80磅,输出的答案为0。文章来源地址https://www.toymoban.com/news/detail-652176.html

到了这里,关于Progressive-Hint Prompting Improves Reasoning in Large Language Models的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Generated Knowledge Prompting for Commonsense Reasoning

    本文是知识图谱系列相关的文章,针对《Generated Knowledge Prompting for Commonsense Reasoning》的翻译。 结合外部知识是否有利于常识推理,同时保持预训练序列模型的灵活性,这仍然是一个悬而未决的问题。为了研究这个问题,我们开发了生成知识提示,它包括从语言模型中生成知

    2024年02月10日
    浏览(37)
  • 论文阅读之Reasoning Implicit Sentiment with Chain-of-Thought Prompting

    本文主要对2023ACL论文《Reasoning Implicit Sentiment with Chain-of-Thought Prompting》主要内容进行介绍。 虽然情绪分析任务中通常根据输入文本中的关键意见表达来确定给定目标的情绪极性,但在隐式情绪分析(ISA)中,意见线索通常是隐含或者模糊的。因此,检测隐含情绪需要常识和

    2024年03月22日
    浏览(56)
  • 论文阅读之Multimodal Chain-of-Thought Reasoning in Language Models

    本文主要对2023一篇论文《Multimodal Chain-of-Thought Reasoning in Language Models》主要内容进行介绍。 大型语言模型(LLM)通过利用思想链(CoT)提示生成中间推理链作为推断答案的基本原理,在复杂推理方面表现出了令人印象深刻的性能。然而,现有的CoT研究主要集中在语言模态上。

    2024年03月14日
    浏览(51)
  • Self-Polish: Enhance Reasoning in Large Language Models via Problem Refinement

    文章链接 核心思想是通过instruction让LLM来优化问题本身,从而达到更好的效果,且这种针对问题的优化可以跟其他的prompt技术,如CoT或者Least-to-Most相结合。 作者提出了一些重述问题的准则: (1)简短:问题不要太长,确保容易理解 (2)清晰:问题表述清晰,能量化的部分

    2024年02月08日
    浏览(40)
  • git [fatal] hint: Pulling is not possible because you have unmerged files.hint: Fix them up in ...

    error: Pulling is not possible because you have unmerged files. 错误:无法提取,因为您有未合并的文件。 hint: Fix them up in the work tree, and then use ‘git add/rm ’ 提示:在工作树中修改它们,然后使用’git add/rm ’ hint: as appropriate to mark resolution and make a commit. 提示:根据需要标记解决方案并提交。

    2024年04月10日
    浏览(47)
  • git pull error: Pulling is not possible because you have unmerged files.hint: Fix them up in the ...

    git pull 报错如下 解决方案如下 PS F:jyjuyi_dataplat_web git pull error: Pulling is not possible because you have unmerged files. 错误:无法提取,因为您有未合并的文件。 hint: Fix them up in the work tree, and then use \\\'git add/rm file\\\' 提示:在工作树中修改它们,然后使用\\\'git add/rm \\\' hint: as appropriate to mark reso

    2024年01月16日
    浏览(75)
  • Diffusion-LM Improves Controllable Text Generation 扩散语言模型改善可控文本生成

    论文链接:https://arxiv.org/abs/2205.14217 代码链接:https://github.com/XiangLi1999/Diffusion-LM 无需重训模型控制语言模型的表现是自然语言生成(NLG)的一个重要开放问题,近期工作已经在简单句子属性控制生成上取得了一定的进展,但是在复杂的、细粒度的控制上的进展还远远不够。

    2023年04月09日
    浏览(45)
  • 【论文笔记】End-to-End Diffusion Latent Optimization Improves Classifier Guidance

    Classifier guidance为图像生成带来了控制,但是需要训练新的噪声感知模型(noise-aware models)来获得准确的梯度,或使用最终生成的一步去噪近似,这会导致梯度错位(misaligned gradients)和次优控制(sub-optimal control)。 梯度错位(misaligned gradients):通过噪声感知模型指导生成模型时,两个

    2024年02月02日
    浏览(52)
  • LLaMA Pro: Progressive LLaMA with Block Expansion

    Q : 这篇论文试图解决什么问题? A : 这篇论文试图解决大型语言模型(LLMs)在特定领域(如编程、数学、生物医学或金融)能力不足的问题。尽管LLMs在多种现实世界任务中表现出色,但在某些特定领域仍然存在局限性,这阻碍了开发通用语言代理以应用于更广泛场景的进展

    2024年01月16日
    浏览(31)
  • Oracle之hint介绍

    CREATE  VIEW stock_item      AS      SELECT /*+ leading(s) use_merge(i) */      i_price, i_name, i_data, s_i_id, s_w_id, s_order_cnt, s_ytd, s_remote_cnt, s_quantity, s_data, s_dist_01, s_dist_02, s_dist_03, s_dist_04, s_dist_05, s_dist_06, s_dist_07, s_dist_08, s_dist_09, s_dist_10      FROM stok s, item i      WHERE s.s_i_id = i.i_id; Query

    2024年02月13日
    浏览(48)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包