admin 管理员组文章数量: 887016
ChatGPT的全名是Chat Generative Pre-trained Transformer,美国OpenAI 研发的聊天机器人程序 ,于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码、论文等任务。在本章的内容中,将详细讲解使用ChatGPT为微信和微信公众号开发一个智能机器人系统的过程。
14.1 ChatGPT介绍
ChatGPT是一个基于大规模预训练语言模型的对话系统,由OpenAI开发。ChatGPT的核心技术是GPT(Generative Pre-trained Transformer)模型,是一种基于深度学习的自然语言处理技术。GPT模型采用Transformer架构,利用无监督学习从大规模语料库中学习语言知识,具有强大的语言理解和生成能力。ChatGPT将GPT模型应用于对话生成,可以进行自然流畅的对话,具有人类般的语言交互能力,本质上是一个聊天工具。
ChatGPT的训练数据来自于大规模的互联网文本语料库,例如维基百科和BookCorpus。通过大规模的训练,ChatGPT可以学习到丰富的语言知识和语言模式,从而能够在各种自然语言处理任务中表现出色。
ChatGPT的应用非常广泛,例如在智能客服中,ChatGPT可以帮助自动回复用户的问题,提高客户服务效率;在机器翻译中,ChatGPT可以帮助实现更准确、流畅的翻译结果;在问答系统中,ChatGPT可以回答用户的问题,从而实现人机交互。
14.1.1 ChatGPT的发展历程
2015年12月,OpenAI公司美国旧金山成立。值得一提的是,特斯拉创始人马斯克也是该公司创始人之一。
2017年,谷歌大脑团队推出了用于自然语言处理的Transformer模型,成为当时最先进的大型语言模型(Large Language Model)。自诞生之日起,Transformer模型就深刻地影响了接下来几年人工智能发展的各个领域,而OpenAI公司就是专注于研究Transformer模型的众多团队之一。
2018年,Transformer模型诞生不到一年,OpenAI就推出了具有1.17亿个参数的GPT-1模型。
2019年,OpenAI公司公布了GPT-2,具有15亿个参数。该模型架构与GPT-1原理相同,主要区别是比GPT-2的规模更大。
2020年,这个创业团队推出了最新的GPT-3模型——这时它具有1750亿个参数。面对如此庞大的GPT-3模型,用户提供小样本的提示语或直接询问,就能获得符合要求的高质量答案。经过早期测试结束后,OpenAI公司对GPT-3模型进行了商业化。
2020年9月,微软公司获得了GPT-3模型的独占许可,意味着微软公司可以独家接触到GPT-3的源代码。
2022年3月,OpenAI推出了InstructGPT模型,该模型为GPT-3的微调版。
2022年11月底,人工智能对话聊天机器人ChatGPT推出,使用的模型是GPT-3.5。短短几个月时间,ChatGPT在2023年1月份的月活跃用户数已达1亿,这使其成为史上用户数增长最快的消费者应用。
2023年3月推出GPT-4,模型系统的能力已经能够把美国的模拟律师资格考试考到前10%了,并且顺利地在美国高考题(SAT考试)中拿到了进入哈佛大学的成绩。有专家认为,GPT-4的专业和学术水平接近人类。
而尚未公布的GPT-5已经看完了人类网络上所有的视频(大约2000PB的容量),可以瞬间标记出所有它看过的视频中的一切声光信息,并且可准确到每一秒。有专家称,GPT-5的智商也许接近天才级别。照这样的演进速度,看起来人工智能的能力将加快超越人类。
现在的ChatGPT可以扮演生活中各种各样的角色,如医生、翻译员、办公助手、程序员、历史学家、情感分析师、心理咨询师、写作润色师等等。它可以根据用户的需求和背景,生成各种类型和风格的文本,并提供有用的信息和建议。
14.1.2 GPT系列的演变
- GPT-1:结合有监督学习和无监督学习,更接近于处理特定语言任务的专家模型,而非通用的语言模型。
- GPT-2:构建了泛化能力更强的语言模型,使得语言模型的通用性得到了更充分的展现。
- GPT-3:参数量相较于 GPT-2 提升了两个数量级,达到了 1750 亿,成为真正意义上的超大语言模型。
- ChatGPT:通过引入人类反馈的强化学习(RLHF)等新的训练方式,语言生成能力大幅提升,并且展现出了思维链和逻辑推理等多种能力。
- GPT-4:在推理能力、文本生成能力、对话能力等方面进一步提升的同时,实现了从大语言模型向多模态模型进化的第一步。
14.1.3 ChatGPT的主要特点
OpenAI使用 RLHF(Reinforcement Learning from Human Feedbac,人类反馈强化学习) 技术对 ChatGPT 进行了训练,且加入了更多人工监督进行微调。此外,ChatGPT 还具有以下特点:
- 可以主动承认自身错误:若用户指出其错误,模型会听取意见并优化答案。
- ChatGPT 可以质疑不正确的问题:例如被询问 “哥伦布 2015 年来到美国的情景” 的问题时,机器人会说明哥伦布不属于这一时代并调整输出结果。
- ChatGPT 可以承认自身的无知,承认对专业技术的不了解。
- 支持连续多轮对话:与大家在生活中用到的各类智能音箱和“人工智障“不同,ChatGPT在对话过程中会记忆先前使用者的对话讯息,即上下文理解,以回答某些假设性的问题。ChatGPT可实现连续对话,极大的提升了对话交互模式下的用户体验。
由于 ChatGPT是一个大型语言模型,目前还并不具备网络搜索功能,因此它只能基于2021年所拥有的数据集进行回答。例如它不知道2022年世界杯的情况,也不会像苹果的Siri那样回答今天天气如何、或帮你搜索信息。如果ChatGPT能上网自己寻找学习语料和搜索知识,估计又会有更大的突破。
14.2 系统介绍
本项目是一个开源项目,开源地址是https://github/xyhelper/xyhelper-web。在本项目中,将在网页中使用ChatGPT的对话模型,实现和ChatGPT官网一样的对话界面。本项目的具体功能如下:
- 基础对话:基于GPT-3.5或GPT-4模型实现会话功能,无需代理,在国内网页即可使用ChatGPT功能。
- 系统设置:可以设置获取ChatGPT服务的接口,Token,头像链接,聊天记录,主题,语言等信息。
本项目是完全开源的,会一直进行技术升级和维护。有关升级信息、使用教程、技术文档等内容,请读者登录https://xyhelper/查看。
14.3 项目结构
本项目的具体结构如图14-1所示。
图14-1 项目结构图
版权声明:本文标题:(14-1)ChatGPT聊天系统(GPT-3.54.0+ Vue+pnpm+SQLite3):ChatGPT介绍+系统介绍+ 项目结构 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.freenas.com.cn/jishu/1729015634h1307178.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论