首页技术总结正文内容

开源版ChatGPT，30分钟训完，性能堪比GPT3.5！

技术总结

更新时间：2024-12-22 21:31:34 6

admin 管理员组

文章数量: 887016

转自：新智元

话说，ChatGPT 开源，是一件好事吗？

此前，OpenAI 不 Open 的事件，已经引发了坊间的诸多争议。

光放出基准和测试结果，不提供训练数据、成本、方法，是真的要「赢家通吃」了。

眼看大语言模型似乎要被巨头公司垄断，如今忽然杀出一个初创公司，给了OpenAI一枪——用60亿参数的「Dolly」实现了和ChatGPT相似的能力。

没错，我们现在只需要准备一些高质量的训练数据，再随便拿一个开源的大语言模型，训练30分钟后，就能得到一个ChatGPT「平替」！

对此，Databricks自豪地表示，Dolly的发布，就是自己在人工智能技术民主化道路上打响的第一弹。

60亿参数堪比ChatGPT，30分钟就训好

由于ChatGPT需要消耗大量的数据和算力资源（利用数万个单词训练，消耗大量GPU），所以这类大语言模型注定只能被少量巨头所掌握。

和「CloseAI」相反，Meta在今年3月向学术界发布了一组高质量（但不是指令跟随的）语言模型LLaMA，每个模型的训练时间超过了80,000个GPU小时。

随后，斯坦福大学基于LLaMA构建了Alpaca，但不同之处在于，它利用一个包含50,000个问题和答案的小数据集进行了微调。令人惊讶的是，这使得Alpaca具有了类似于ChatGPT的交互性。

而Dolly正是受到了Alpaca的启发。

更有趣的是，拥有60亿参数的Dolly并没有利用现在最新的模型，而是选择了一个2021年发布的开源模型——GPT-J。

由于Dolly本身是一个模型的「克隆」，所以团队最终决定将其命名为「多莉」——有史以来第一个被克隆的动物。

与当前的大型语言模型（如GPT-3）相比，Dolly允许用户使用更小、更专业的模型，「复刻」ChatGPT的能力。

毕竟对于那些细分用户来说，能够利用针对本行业进行过精调的模型，可以大大增加性能和准确性。

尽管Databricks与OpenAI并无直接竞争关系，但它似乎试图通过证明构建类似ChatGPT这样的服务并非看起来那么困难，来抢占OpenAI的风头。

尤其是，OpenAI采取了「规模越大越好」的方法来开发语言模型，并对其工作越来越保密。

而Databricks除了将Dolly作为开源软件发布外，还强调Dolly只有60亿个参数（在训练过程中微调的语言模型部分），OpenAI的GPT-3模型有1750亿个参数。（OpenAI并未透露GPT-4的参数数量）。

让老模型，涅槃重生

根据InstructGPT论文中描述的指令跟随能力对Dolly进行评估后发现，它在很多能力上的表现和ChatGPT十分类似，包括文本生成、头脑风暴和开放式问答。

在这些例子中，值得注意的不是生成文本的质量，而是在一个小型的高质量数据集上，微调一个旧的开源模型所带来的指令跟随能力的巨大改进。

内容生成

比如，写一条Databricks官宣大规模语言模型Dolly发布的推特。

可以看到，原始的60亿参数模型（GPT-J）所生成的内容驴唇不对马嘴，而Dolly则给出了一个完全可用的推文——

不仅内容符合要求，而且还贴心地加上了标签，以及提醒你记得加入发布的链接。

对于这一题，ChatGPT给出的答案也是符合期待的，相比于Dolly，ChatGPT给出的推文包含更多评述性词句，并且给出的标签更加精准具体，但整体差距不大。

当要写一条出售Nikon D-750相机的广告时，可以看到，GPT-J所生成的内容基本就在胡编乱造，像是在写小说一样杜撰购买和出售相机的剧情……

而Dolly则根据Nikon D-750相机的特点及优势，给出了一则吸引人的相机转卖广告语，但遗憾的是像素参数不对。

ChatGPT在这一题上也是圆满完成任务，广告语中突出该款相机的优势，文末仍然贴心地加上了标签。

最后一题：给Edgar Allan Poe（爱伦·坡）写一封情书。

对此，古早的GPT-J直接拒绝回答，究其原因竟然是——爱伦·坡已经去世了，你不能给私人写情书。

而Dolly则成功地完成了任务，效果对比起来堪称「涅槃」。

而这种「创造性」问题，显然是ChatGPT的强项，洋洋洒洒地写了300多个字。

开放问答

在事实性问题的问答测试上，团队选择了下面这个：「向我解释一下核裂变和核聚变之间的区别。」

先不管对错，GPT-J全篇都是在讲太阳如何如何，虽然提到了「聚变」这个词，但完全无视了「裂变」。

而Dolly第一句就直接点题——核裂变和核聚变的区别在于释放能量的方式，随后简单解释了他们的不同。

相比之下，ChatGPT给出的回答明显要更加翔实。

头脑风暴

当让它们头脑风暴，给出应该阅读的五本科幻小说的名单，GPT-J则只是在喃喃自语，像是沉浸在了拖延阅读而产生的愧疚情绪中，完全回避了这个提问。

Dolly则一如既往的表现稳定，按照指令给出了5本科幻小说的书名及其作者。

ChatGPT对于该问题给出了更加丰富的回答，不仅包括书名和作者，还对每一本书的内容、类型作了简要评述和介绍。

你要Close，我就Open

对于很多公司而言，宁愿自己建立一个不那么强的模型，也不愿将数据发送给那些只提供API的大语言模型供应商。

其中一个重要原因便是，这些问题和数据集是公司最敏感和专有的知识产权，直接将其交给第三方显然是不靠谱的。

此外，公司自身可能在模型质量、成本和期望行为方面有不同的权衡，一种可定制化的语言模型更加符合需求。

现在，Dolly的发布给了他们希望——即便是一个「过时」的开源大型语言模型 (LLM)，也能通过30分的训练，赋予它神奇的类似ChatGPT的指令跟随能力。

不难想象，大语言模型或许很快就不是AI巨头公司独占的玩法了！

正如公司CEO Ali Ghodsi所说，「我们的信念是，让全世界的每个组织都能利用这些技术。」

参考资料：

https://www.databricks/blog/2023/03/24/hello-dolly-democratizing-magic-chatgpt-open-models.html

https://venturebeat/ai/databricks-debuts-chatgpt-like-dolly-a-clone-any-enterprise-can-own/

更多相关文章

OpenAI将禁止中国使用ChatGPT了，你知道吗？

技术总结

2月前

由于政策、法律原因，2024年7月9日以后OpenAI将禁止中国使用ChatGPT 以及调用相关接口，这样的话国内就没法使用ChatGPT 开发应用了。不过不要急，国内有很

揭开ChatGPT面纱（1）：准备工作（搭建开发环境运行OpenAI Demo）

技术总结

2月前

文章目录序言：探索人工智能的新篇章一、搭建开发环境二、编写并运行demo1.代码2.解析3.执行结果本博客的gitlab仓库：地址，本博客对应01文件夹。序言&

ChatGPT翻译器：AI驱动的多语言翻译新时代

技术总结

2月前

ChatGPT翻译器:AI驱动的语言障碍消除者在全球化日益加深的今天,跨语言交流的需求变得越来越普遍和迫切。传统的机器翻译虽然方便快捷,但在准确性和语境理解方面仍存在不少局限。而近年来迅速发展的人工智能技术,特别是大型语言模型(LLM)

ChatGPT技巧｜ChatGPT 图片生成器:所有不可不知的一切!

技术总结

2月前

微软开创性的AI 框架ChatGPT 4 Image Creator (Visual ChatGPT) 结合了两种高效的ChatGPT 和VFMs（视觉函数操作）方法。这个复杂的模型开发了一个对

用ChatGPT 可以写毕业论文吗？

技术总结

1月前

利用AI工具批量生成影视短剧推广https:docs.qqdocDYnl6d0FLdHp0V2ll当然用GPT来写论文，GPT那么好用，为什么不用？ 只是要讲求方法

Linux系统腾讯云服务宝塔面板安装《最新版本2024》禅道开源版本20.2

技术总结

1月前

文章目录目录文章目录安装流程小结概要安装流程技术细节小结概要有两种方式1.自带有服务器安装和2.使用禅道官方的服务器免费使用第一种：免费的提供5人使用，存储的数据大小也是有限制

关于ChatGPT的something went wrong等问题的解决方法

技术总结

1月前

关于ChatGPT的something went wrong等问题的解决方法问题日期： 2024.05.19 问题： ChatGPT会话历史无法加载；ChatGPT显

深聊性能测试，从入门到放弃之： Windows系统性能监控(三)任务管理器介绍及使用。

技术总结

1月前

任务管理器 1、引言2、任务管理器2.1 打开方式2.2 介绍2.2.1 定义2.2.2 进程2.2.3 性能2.2.4 应用历史记录2.2.5 启动2.2.6 用户2.2.7 详细信息2.2.8 服务 3、总结 1、引言关于Windo

大致讲一下ChatGPT的原理，给小孩子解释什么是ChatGPT

技术总结

1月前

国外有个博主写了一篇博文，名字叫「ChatGPT： Explained to Kids」，直译过来就是，给小孩子解释什么是ChatGPT。因为现实

使用开源软件7ZIP在Windows压缩.tar.gz格式包

技术总结

1月前

背景：项目要搞自动化部署，需要将自动化部署的包打成 .tar.gz格式上传到linux。在Linux上压缩包.tar.gz命令：tar -zcf fileName.tar.

【大模型】ChatGPT API key 获取到代码集成使用详解

技术总结

18天前

目录一、前言二、获取apikey 2.1 进入OpenAI官网 2.2 创建密钥 2.2.1 输入密钥三、apikey使用 3.1 账号等级与模型 3.1.1 提升等级 3.1.2 了解不同的模型 3.2 open

如何用windows自带工具检测磁盘性能

技术总结

18天前

如何用windows自带工具检测磁盘性能有一天突然想检测一下磁盘性能，市面上工具大多夹杂垃圾广告包装起来。其实利用windows自带工具就可以轻松检测。新建txt文件，修改后缀名.bat为

ChatGPT - 中文版

技术总结

15天前

你用过最好用的AI工具有哪些？ 简介：探讨人们在使用AI工具时，最喜欢的和认为最好用的工具是哪些，展示AI技术的实际应用和影响。提醒&#xff

chatgpt体验

技术总结

15天前

露个相吧 1、相信很多小伙伴们面试或者工作中会遇到数组扁平化这一问题，如今正是智能大火的时候，何不让我们试试水呢，所以让我们的智能用js帮我们写一个数组扁平化吧 2、这就&a

ChatGPT高效提问—prompt常见用法（续篇九）

技术总结

15天前

ChatGPT高效提问—prompt常见用法（续篇九） 如何准确地向大型语言模型提出问题，使其更好地理解我们的意图，从而得到期望的答案呢&

ChatGPT 中文版：国内镜像网站推荐【12月持续更新】

技术总结

11天前

一、ChatGPT中文镜像站 ① https:chat.lify.vip 支持GPT4、4o以及o1，支持MJ绘画什么是镜像站镜像站（Mirror Site）是指

ChatGPT 5.0：一年半后的展望与看法

技术总结

10天前

在人工智能领域，每一次技术的飞跃都预示着未来生活与工作方式的深刻变革。随着OpenAI在人工智能领域的不断探索与突破，ChatGPT系列模型已成为全球关注的焦点。当谈及ChatGPT 5.0在未来

ChatGPT模型常用参数设置(temperature, max_tokens, presence_penalty, frequency_penalty, top_p, n)

技术总结

1天前

在使用OpenAI的ChatGPT模型时，有几个关键参数可以配置，以控制生成的文本的行为和特性，本文本将介绍如何设置这些常见的参数。 1. Temperature参数 1

[转]笔记本电脑处理器(CPU)性能排行榜

技术总结

6小时前

笔记本电脑处理器(CPU)性能排行榜本排行榜随新款处理器(CPU)的发布而随时更新。更新日期：2010年7月14日排名厂商型号前端总线(MHz)二级三级缓存主频(MHz)功率(瓦)制造工艺(纳米)核心线程64位1

发表评论

全部评论 0

暂无评论

技术交流 – FreeNAS中文网

开源版ChatGPT，30分钟训完，性能堪比GPT3.5！

60亿参数堪比ChatGPT，30分钟就训好

让老模型，涅槃重生

内容生成

开放问答

头脑风暴

你要Close，我就Open

更多相关文章

OpenAI将禁止中国使用ChatGPT了，你知道吗？

揭开ChatGPT面纱（1）：准备工作（搭建开发环境运行OpenAI Demo）

ChatGPT翻译器：AI驱动的多语言翻译新时代

ChatGPT技巧｜ChatGPT 图片生成器:所有不可不知的一切!

最新版ChatGPT对话系统源码 Chat Nio系统源码

用ChatGPT 可以写毕业论文吗？

Linux系统 腾讯云服务宝塔面板安装《最新版本2024》禅道开源版本20.2

关于ChatGPT的something went wrong等问题的解决方法

深聊性能测试，从入门到放弃之： Windows系统性能监控(三)任务管理器介绍及使用。

大致讲一下ChatGPT的原理，给小孩子解释什么是ChatGPT

使用开源软件7ZIP在Windows压缩.tar.gz格式包

【大模型】ChatGPT API key 获取到代码集成使用详解

如何用windows自带工具检测磁盘性能

ChatGPT - 中文版

chatgpt体验

ChatGPT高效提问—prompt常见用法（续篇九）

ChatGPT 中文版：国内镜像网站推荐【12月持续更新】

ChatGPT 5.0：一年半后的展望与看法

ChatGPT模型常用参数设置(temperature, max_tokens, presence_penalty, frequency_penalty, top_p, n)

[转]笔记本电脑处理器(CPU)性能排行榜

发表评论

推荐文章

新手小白用PVE安装部署自己的家庭网络服务器1--PVE的安装和优化设置

【愚公系列】2024年03月 《网络安全应急管理与技术实践》 021-网络安全应急技术与实践（主机层-Windows 检查演练）

matplotlib画饼图

java计算机毕业设计高校会议室预约系统源码+mysql数据库+系统+lw文档+部署

操作系统发展历程 (Unix、Linux、windows)

热门文章

吴恩达《ChatGPT Prompt Engineering for Developers》课程中文版、学习笔记

GetLastError()返回值列表

Go工作空间

从SHAttered事件谈安全

PAT（乙级） 1003.我要通过

Recuva免费数据恢复工具

MySQL 8.0.27 下载、安装与配置 超详细教程（Windows64位）

我重生了，回到了18岁，这一世一定要从0开始成为极客之渗透安全扫盲（下）

Win7延长激活时间方法(微软官方文档)

win凭据添加计算机名,win7 凭据的永久性问题

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

苹果电脑windows系统换苹果系统

Win11系统崩溃错误修复指南：三种实用方法详解

如何封装一个自己的win7系统并安装到电脑做成双系统

如何在Excel 2019中开启数据分析工具？

批量激活管理工具VAMT 3.0的安装与基本使用方法简介

Linux系统腾讯云服务宝塔面板安装《最新版本2024》禅道开源版本20.2

【愚公系列】2024年03月《网络安全应急管理与技术实践》 021-网络安全应急技术与实践（主机层-Windows 检查演练）

MySQL 8.0.27 下载、安装与配置超详细教程（Windows64位）