首页技术总结正文内容

Claude和ChatGPT到底选择谁？用真实数据对比

技术总结

更新时间：2024-12-22 11:11:12 4

admin 管理员组

文章数量: 886992

关于“Claude和ChatGPT到底选择谁的问题”，如果是放到2个月前，我或许会毫不犹豫选择ChatGPT，不过最近Claude的一顿更新，让我一下子难以做出选择。有人说ChatGPT是理科生，在数学，逻辑推理能力更强，而说Claude是文科生，在写作方面表现更强。

可事实真的如此吗？

下面我将对Claude 和ChatGPT 两个模型的会员版进行深层次全面的对比。

作为一个Claude和ChatGPT都在使用的深度用户。在使用ChatGPT时，我特别喜欢它的Canvas功能，而在使用Claude时，我则更喜欢Artifacts功能。因此除了从模型的基础能力，我们还要看它们俩具体有哪些功能，从普通人视角，来进行比较。

Claude和ChatGPT的主要功能比较

ChatGPT的功能

Canvas: ChatGPT的Canvas功能使用户能够与AI合作完成写作和编码项目，提供了内联编辑、代码调试和文档版本控制等工具。这一功能特别适合需要团队协作的环境，如共同开发软件或撰写技术文档。
GPTs: 该功能允许用户创建定制的AI助理，执行网页搜索、图像制作或数据分析等任务，无需编程技能。这一功能适合客户服务、数据分析和内容创作等需要定制化AI助理的场景。
AI搜索功能: ChatGPT新增的搜索功能可以结合网络搜索结果提供答案，支持网页版以及手机和桌面应用。这使得用户可以快速获得最新的学术论文和研究成果，加速研究过程。
DALL·E功能: ChatGPT集成了DALL·E功能，可以根据自然语言描述来创建图像，非常适合广告设计、产品原型制作或社交媒体内容创作。
高级语音：ChatGPT的高级语音功能能够让用户和ChatGPT进行语音对话，而且就目前市面上，ChatGPT的高级语言功能最为逼真，所以不少人会拿它练英语口语等。

Claude的功能

Artifacts: Claude的Artifacts功能让用户可以在对话中创建和引用如代码片段、文本文档和网站设计等大量独立的内容，同时支持实时查看、编辑和构建内容。
数据可视化: Claude的数据分析功能支持用户编写并直接运行JavaScript代码，进行复杂的数据处理和实时分析，非常适用于需要进行数据分析和可视化的场景，如市场分析、财务报告或科学研究。
可视化PDF: Claude能够查看和分析PDF中的图像、图表和图形，适用于处理少于100页的PDF文件。这一功能适合技术文档审阅、学术论文分析或法律文件审查。
Computer use: 通过Claude的API，用户可以控制电脑执行搜索、数据分析和文档处理等任务，类似于一个智能个人助理，适用于自动化计算机操作的场景。
LaTeX渲染: Claude能够一致地呈现数学方程式，适用于处理数学公式和科学文献，如学术论文撰写、技术报告或教育教学。

ChatGPT 和 Claude 都是功能强大的AI模型，但各有专长。ChatGPT以其多功能全面著称，它就像一个多面手，应用场景特别广泛，包括写作协作、自定义AI助手、网络搜索、图像生成和语音对话。

而Claude则专注于编码和专业写作，提供代码片段管理、数据可视化、PDF分析等功能，特别适合技术和学术领域。

如果是你，你会为了它们俩的哪个功能订阅它们呢？

基础能力对比，看谁更强

首先，我们看一下Claude和ChatGPT在国内基准数据集的得分。

由于 Claude 和 ChatGPT 等模型在评估基本能力时，通常使用国外的基准数据集。然而，中文和英文在语言结构和表达方式上存在显著差异。为更准确地评估模型在中文语境下的表现，我选择了国内权威的模型测试机构——CLUE（中文语言理解测评基准）。

时间拉回最新版Claude 3.5 sonnet发布时，CLUE中文语言理解测评基准第一时间进行了评测，评测结果如下：

中文代码：

o1-preview＞Claude 3.5 Sonnet＞GPT-4o

Claude 3.5 Sonnet(1022)在中文代码能力（SC-Code3）上表现不俗，总分达到84.85分，较GPT-4o-0513高1.52分，较o1-preview低4.54分。其中，在高级代码任务上表现惊艳，得分69.23分，与o1-preview打平。

复杂任务高阶推理能力：

o1-preview＞GPT-4o＞Claude 3.5 Sonnet

Claude 3.5 Sonnet(1022)在中文高阶推理任务上取得74.54分，接近ChatGPT-4o-latest，相较o1-preview还有较大差距（-10.73分）。其中，多步推理能力相对突出，超过了ChatGPT-4o-latest。

同时，我还准备了最新LMSYS竞技场的数据。

LMSYS竞技场

LMSYS竞技场是：由加州大学伯克利分校 SkyLab 和 LMSYS 的研究人员开发。该平台拥有超过 1,000,000 张用户投票，使用 Bradley-Terry 模型生成实时排行榜，对最佳 LLM 和 AI 聊天机器人进行排名。

刚刚截了最新关于LMSYS竞技场的数据，显示最新版的Claude 3.5 sonnet要落后于GPT 4o和o1-preview模型。

所以从数据层面表明，ChatGPT的o1模型还是要远远强于最新版的Claude 3.5 sonnet，如果你追求哪个模型强，那基本可以无脑冲ChatGPT了。

本文标签：真实数据 Claude ChatGpt

版权声明：本文标题：Claude和ChatGPT到底选择谁？用真实数据对比内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1733525792h1602603.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

发表评论

全部评论 0

暂无评论

技术交流 – FreeNAS中文网

Claude和ChatGPT到底选择谁？用真实数据对比

Claude和ChatGPT的主要功能比较

基础能力对比，看谁更强

更多相关文章

【AIGC】ChatGPT开发者必备：如何获取 OpenAI 的 API Key

使用 ChatGPT 总是出现「Something went wrong」解决方案

火车头采集器python CHATGPTAI改写插件使用教程！

OpenAi推出ChatGPT客户端

用ChatGPT 可以写毕业论文吗？

2021 Java后端+大数据暑期实习大厂面经

【api连接ChatGPT的最简单方式】

使用Windows自带chkdsk命令修复一些硬盘和U盘存储不了数据的问题

大数据学习笔记 第1天 Linux(一)

【AIGC】ChatGPT提示词Prompt高效编写技巧：逆向拆解OpenAI官方提示词

关于ChatGPT的something went wrong等问题的解决方法

吴恩达《ChatGPT Prompt Engineering for Developers》课程中文版、学习笔记

Claude 3.5深夜觉醒，学会模仿人类用电脑！编程干翻o1，Agent一夜变天

Python新闻网站项目-2.Scrapy爬虫的配置和数据抓取

数据库误操作，如何恢复数据（SQL事务，或数据库还原）

【ChatGPT】让ChatGPT生成跨语言翻译的精确提示

ChatGpt翻译指令

真实可用，Xshell7 期待您的安装使用

ChatGPT资源合集

mac 完全删除 docker volume_清理 OSX 系统中的 Docker 容器、镜像与数据卷

发表评论

推荐文章

油价继续下滑并接近跌破70关口

谷歌浏览器下载安装

怎么查看windows系统激活多久

Windows系统在CMD命令行中用del命令删除文件

Ryzen Master只能在Windows操作系统中禁用基于虚拟化的安全性(VBS) 解决方案

热门文章

kotlin协程中使用Dispatchers.Main报错的问题

IAR for RH850下载弹出错误The TP power is turned on even though the internal power supply has been specifie

CODE： 游乐园的迷宫

莫忽视：近视对孩子的危害

NT

9个适用于多语言网站的最佳WordPress翻译插件

安全管理信息系统的特点有360终端安全管理系统（一体化版）_新手漏洞技巧

【11.22更新】Win10 22H2 19045.5198 正式版镜像免费下载！

windows系统盗版赔偿

linux,windows双系统共享鼠标键盘

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

如何将必应（Bing）的背景图片设定成 Windows 7 的主题

Windows 7 IIS (HTTP Error 500.21 - Internal Server Error)解决

Windows 7中使用HomeGroup需要打开的端口

GRUB 2：恢复被Windows 7覆盖的Ubuntu 9.10

win7下cuda8.0安装跑gpu版tensorflow

大数据学习笔记第1天 Linux(一)

CODE：游乐园的迷宫