【Chain-FreeNAS中文网

admin 管理员组

文章数量: 887031

【Chain

【Chain-of-Thought 专题】Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

ChatGPT 🔥🔥🔥🔥火了
GPT-4 🔥🔥🔥🔥🔥 已于2023年3月15日凌晨发布

作为NLP Researcher

不了解预训练语言模型、prompt-tuning、chain-of-thought

你一定会被OUT！

走向NLP最前沿，你只需阅读下面两篇博客！！！

快速学习预训练语言模型，进入专栏阅读：预训练语言模型
深入学习Prompt-Tuning：点击阅读：Prompt-Tuning——深度解读一种新的微调范式
Prompting——深度解读一种全新的微调范式

Chain of Thought（CoT）—— a series of intermediate reasoning steps—significantly improves the ability of large language models to perform complex reasoning.

一、介绍

增大模型参数规模对于一些具有挑战的任务（例如算术、常识推理和符号推理）的效果并未证明有效；

Scaling up model size alone has not proved sufficient for achieving high performance on challenging tasks such as arithmetic, commonsense, and symbolic reasoning.

因此我们期望探索如何对大模型进行推理的简单方法：

对于算术类推理任务，期望生成自然语言逻辑依据来指导并生成最终答案；但是获得逻辑依据是比较复杂昂贵的。

It is costly to create a large set of high quality rationales, which is much more complicated than simple input–output pairs used in normal machine learning.

对某个task，为大模型提供一些上下文in-context example作为prompt；简单的示例可能并非能够提升推理能力。

It works poorly on tasks that require reasoning abilities, and often does not improve substantially with increasing language model scale.

本文提出chain of thouth prompting：A chain of thought is a series of intermediate natural language reasoning steps that lead to the final output, and we refer to this approach as chain-of-thought prompting.

二、Chain-of-Thought

下面给出几个Chain-of-Thought样例：

传统的方法是，给定几个人工标注的Template，或者少量样本作为In-Context Example来提示大模型生成结果。但是这种方式无法保证生成结果的可靠性。为了进一步提高大模型对于一些较为复杂任务的表现。CoT旨在通过在In-Context Learning的基础上，对每个问题（Question）输出结果（Answer）的同时，提供解答的推理依据（Rationale），这种依据通常是一种推理路径（Reason Path）的形式呈现。通过展示对一个问题的解答，能够很好地激发出模型按照人类思考的模式生成合理的答案。

例如在数学计算问题上，只需要人工标注少量的chain-of-thought，即可以得到很惊艳的效果：

事实证明，Chain-of-Thought对超过1000亿参数量规模的模型所展现的性能提升效果是很明显的。

更多基于GPT-3的Chain-of-Thought的Benchmark详见：。

三、Chain of Thought的未来工作：

虽然Chain-of-Thought模拟了人类推理者的思维过程，但这并不能回答神经网络是否真的“推理”，我们将其作为一个悬而未决的问题。
尽管在少样本设置中手动增加具有思想链的样本的成本是最小的，但这样的注释成本对于微调来说可能是令人望而却步的（尽管这可能会被合成数据生成或零样本泛化所克服）。
不能保证正确的推理路径，这可能导致正确和错误的答案；改进事实语言模型是未来工作的一个开放方向。
仅在大型模型尺度上出现的思维链推理使得在实际应用中服务的成本很高；进一步的研究可以探索如何在较小的模型中进行推理。

本文标签： chain

版权声明：本文标题：【Chain 内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/free/1700335858h402272.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

技术交流 – FreeNAS中文网

【Chain

【Chain

【Chain-of-Thought 专题】Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

作为NLP Researcher

不了解预训练语言模型、prompt-tuning、chain-of-thought

你一定会被OUT！

一、介绍

二、Chain-of-Thought

三、Chain of Thought的未来工作：

更多相关文章

job chain job classs oracle,揭开job,scheduler,program,chain,job

【Chain

发表评论

推荐文章

小米手机投屏到Windows笔记本电脑的3个方法，随便选一个

谋划创业第N+1天

idea debug 无法启动项目解决 Unable to open debugger port (127.0.0.1:50812)

从零搭建若依(Ruoyi

网工，敢问路在哪里？！

热门文章

2012服务器系统设置自动重启,Windows Server 2012 R2系统重启方法

amd核芯显卡控制面板自定义分辨率_深入浅出笔记本电脑-GPU显卡篇

帆软：链接弹出新页

控制工程第五笔记

游戏设计大师之路

Package name 'xxx' does not correspond to the file path 'yyy'

物联网用户消费仅七毛六分钱，价格成为5G工业互联推广的最大障碍

Windows 11 中如何为 Linux 安装 Windows 子系统：详细教程

windows配置ansible环境

windows安装系统

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

戴尔t310服务器装系统步骤,dell笔记本重装系统教程

惠普ENVY x360 14 2024 锐龙版笔记本重装win7系统教程

通过U盘启动盘安装Windows10操作系统步骤

Win7怎么使用PE重装系统？PE重装系统步骤图

不用优盘如何重装系统win7 不用优盘怎么重装系统win7