admin 管理员组

文章数量: 887016

ChatGPT的全名是Chat Generative Pre-trained Transformer,美国OpenAI 研发的聊天机器人程序 ,于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码、论文等任务。在本章的内容中,将详细讲解使用ChatGPT为微信和微信公众号开发一个智能机器人系统的过程。

14.1  ChatGPT介绍

ChatGPT是一个基于大规模预训练语言模型的对话系统,由OpenAI开发。ChatGPT的核心技术是GPT(Generative Pre-trained Transformer)模型,是一种基于深度学习的自然语言处理技术。GPT模型采用Transformer架构,利用无监督学习从大规模语料库中学习语言知识,具有强大的语言理解和生成能力。ChatGPT将GPT模型应用于对话生成,可以进行自然流畅的对话,具有人类般的语言交互能力,本质上是一个聊天工具。

ChatGPT的训练数据来自于大规模的互联网文本语料库,例如维基百科和BookCorpus。通过大规模的训练,ChatGPT可以学习到丰富的语言知识和语言模式,从而能够在各种自然语言处理任务中表现出色。

ChatGPT的应用非常广泛,例如在智能客服中,ChatGPT可以帮助自动回复用户的问题,提高客户服务效率;在机器翻译中,ChatGPT可以帮助实现更准确、流畅的翻译结果;在问答系统中,ChatGPT可以回答用户的问题,从而实现人机交互。

14.1.1  ChatGPT的发展历程

2015年12月,OpenAI公司美国旧金山成立。值得一提的是,特斯拉创始人马斯克也是该公司创始人之一。

2017年,谷歌大脑团队推出了用于自然语言处理的Transformer模型,成为当时最先进的大型语言模型(Large Language Model)。自诞生之日起,Transformer模型就深刻地影响了接下来几年人工智能发展的各个领域,而OpenAI公司就是专注于研究Transformer模型的众多团队之一。

2018年,Transformer模型诞生不到一年,OpenAI就推出了具有1.17亿个参数的GPT-1模型。

2019年,OpenAI公司公布了GPT-2,具有15亿个参数。该模型架构与GPT-1原理相同,主要区别是比GPT-2的规模更大。

2020年,这个创业团队推出了最新的GPT-3模型——这时它具有1750亿个参数。面对如此庞大的GPT-3模型,用户提供小样本的提示语或直接询问,就能获得符合要求的高质量答案。经过早期测试结束后,OpenAI公司对GPT-3模型进行了商业化。

2020年9月,微软公司获得了GPT-3模型的独占许可,意味着微软公司可以独家接触到GPT-3的源代码。

2022年3月,OpenAI推出了InstructGPT模型,该模型为GPT-3的微调版。

2022年11月底,人工智能对话聊天机器人ChatGPT推出,使用的模型是GPT-3.5。短短几个月时间,ChatGPT在2023年1月份的月活跃用户数已达1亿,这使其成为史上用户数增长最快的消费者应用。

2023年3月推出GPT-4,模型系统的能力已经能够把美国的模拟律师资格考试考到前10%了,并且顺利地在美国高考题(SAT考试)中拿到了进入哈佛大学的成绩。有专家认为,GPT-4的专业和学术水平接近人类。

而尚未公布的GPT-5已经看完了人类网络上所有的视频(大约2000PB的容量),可以瞬间标记出所有它看过的视频中的一切声光信息,并且可准确到每一秒。有专家称,GPT-5的智商也许接近天才级别。照这样的演进速度,看起来人工智能的能力将加快超越人类。

现在的ChatGPT可以扮演生活中各种各样的角色,如医生、翻译员、办公助手、程序员、历史学家、情感分析师、心理咨询师、写作润色师等等。它可以根据用户的需求和背景,生成各种类型和风格的文本,并提供有用的信息和建议。

14.1.2  GPT系列的演变

  1. GPT-1:结合有监督学习和无监督学习,更接近于处理特定语言任务的专家模型,而非通用的语言模型。
  2. GPT-2:构建了泛化能力更强的语言模型,使得语言模型的通用性得到了更充分的展现。
  3. GPT-3:参数量相较于 GPT-2 提升了两个数量级,达到了 1750 亿,成为真正意义上的超大语言模型。
  4. ChatGPT:通过引入人类反馈的强化学习(RLHF)等新的训练方式,语言生成能力大幅提升,并且展现出了思维链和逻辑推理等多种能力。
  5. GPT-4:在推理能力、文本生成能力、对话能力等方面进一步提升的同时,实现了从大语言模型向多模态模型进化的第一步。

14.1.3  ChatGPT的主要特点

OpenAI使用 RLHF(Reinforcement Learning from Human Feedbac,人类反馈强化学习) 技术对 ChatGPT 进行了训练,且加入了更多人工监督进行微调。此外,ChatGPT 还具有以下特点:

  1. 可以主动承认自身错误:若用户指出其错误,模型会听取意见并优化答案。
  2. ChatGPT 可以质疑不正确的问题:例如被询问 “哥伦布 2015 年来到美国的情景” 的问题时,机器人会说明哥伦布不属于这一时代并调整输出结果。
  3. ChatGPT 可以承认自身的无知,承认对专业技术的不了解。
  4. 支持连续多轮对话:与大家在生活中用到的各类智能音箱和“人工智障“不同,ChatGPT在对话过程中会记忆先前使用者的对话讯息,即上下文理解,以回答某些假设性的问题。ChatGPT可实现连续对话,极大的提升了对话交互模式下的用户体验。

由于 ChatGPT是一个大型语言模型,目前还并不具备网络搜索功能,因此它只能基于2021年所拥有的数据集进行回答。例如它不知道2022年世界杯的情况,也不会像苹果的Siri那样回答今天天气如何、或帮你搜索信息。如果ChatGPT能上网自己寻找学习语料和搜索知识,估计又会有更大的突破。

14.2  系统介绍

本项目是一个开源项目,开源地址是https://github/xyhelper/xyhelper-web。在本项目中,将在网页中使用ChatGPT的对话模型,实现和ChatGPT官网一样的对话界面。本项目的具体功能如下:

  1. 基础对话:基于GPT-3.5或GPT-4模型实现会话功能,无需代理,在国内网页即可使用ChatGPT功能。
  2. 系统设置:可以设置获取ChatGPT服务的接口,Token,头像链接,聊天记录,主题,语言等信息。

本项目是完全开源的,会一直进行技术升级和维护。有关升级信息、使用教程、技术文档等内容,请读者登录https://xyhelper/查看。

14.3  项目结构

本项目的具体结构如图14-1所示。

图14-1  项目结构图

本文标签: 系统 结构 项目 GPT ChatGpt