首页技术总结正文内容

腾讯大模型 App 正式上线，全面接入微信 QQ 等 600+ 业务！

技术总结

更新时间：2024-12-25 13:06:57 3

admin 管理员组

文章数量: 887501

移动互联网有 12 亿用户，AI 头部产品却只有百万量级的日活。

作者 | 王启隆

责编 | 唐小引

出品丨AI 科技大本营（ID：rgznai100）

北京时间 5 月 30 日，基于混元大模型的 C 端 App「腾讯元宝」正式上线，各大应用商店一早就开放了下载，这款应用瞄准了大家在工作效率场景中的核心需求：信息获取 — 处理 — 生产，对应了其主打的 AI 搜索 + AI 总结 + AI 写作 三大功能，深度贴合每个人的实际生活。

CSDN 现场参加了「元宝」的媒体沟通会，腾讯云副总裁、腾讯混元大模型负责人刘煜宏发表演讲，同时做了不少的演示。

这次真正主打的核心功能是 AI 搜索，腾讯其实在搜索上有着相当久远的历史。除了大家现在熟悉的微信搜一搜，腾讯还有搜狗搜索，其前身是“门户时代”的 Soso，至今已经有了 18 年的历史，可谓时代的眼泪。现在结合了 AI 技术增强，既有传统的稳定性，又有更智能的生成答案，问它电视剧都能答上来：

元宝的最大特色是深度整合了腾讯自家的微信生态资源，特别是微信公众号这一内容丰富的平台 —— 基于公众号的搜索，全网只有这一家。前阵子谷歌 CEO 才说 AI 搜索“幻觉”问题无法解决，所以腾讯规避问题的方式也很简单粗暴，因为它很多时候做的不完全是搜索，而是对自己搜索到的公众号进行了总结。

我们这就考考元宝，看它认不认识 CSDN 最新上市的《新程序员 007》：

这题不难，只要读了标题就能解出来。

接下来再考考元宝，看它读没读文章内容：

看来，只要是公众号上面的知识，都难不倒它了。

在 AI 总结方面，元宝可上传最多 10 个 PDF、word、txt 等多种格式的文档，并能够一次性解析多个微信公众号链接、网址。刘煜宏介绍元宝拥有 256K 的原生窗口上下文，这相当于一本《三国演义》，或是英文原版的《哈利波特》全集。

这段时间“AI 教母”李飞飞创业的事特别火，而她创业前其实还在斯坦福以人为中心的人工智能研究所（HAI）发布了一篇年度报告，我们先前做过公众号文章，看看元宝能否总结这份图文并茂的报告：

到了 AI 写作这块儿，刘煜宏强调了元宝的多轮问答能力，甚至表示元宝能够将对话的内容整理成报告，按照要求进行结构化输出，大大提升信息从获取到处理再到生产的效率。

创意写作现在似乎已经成为了各大通用模型的“基本功”了，所以我更想测试它有趣的文生图能力。点开 App 上方的「发现」一栏，我发现元宝预设了一堆琳琅满目的智能体。现在我想绘画，所以选择了「创意绘画」：

先来一张像素风的城市落日图：

在这个预设的智能体里面，我还可以进行风格切换和比例设置，值得点个赞。

切换成「油画」风格和 16：9 比例之后，我又让元宝生成了一张城市落日图：

智能体的效果还是相当不错的。刘煜宏在沟通会上表示，腾讯之前已经推出过了“元器”这样的创作者工具平台，鼓励开发者、企业乃至普通用户自行创建个性化的智能体。目前，腾讯的产品策略着重于早期阶段的内部需求满足和用户体验的提升。所以，未来元宝不会再推出太多的预设智能体，而是通过智能体创作平台的开放和腾讯插件的支持，鼓励开发者自主构建智能体，实现技术的广泛应用。

下面，让我们进一步了解元宝还有哪些秘密。

脱胎换骨

元宝背后的混元目前有多强？刘煜宏给出了一个数字：自发布以来，混元模型的性能提升了 50%。

参数方面，千亿升级到了万亿。

训练和推理框架上，腾讯自研的机器学习平台训练速度是主流框架的 2.6 倍，大模型推理成本相比业界主流框架下降 70%。此外，预训练语料还从万亿升级至了 7 万亿 tokens。

算法上，稠密模型已经演变为时流行的 MoE（专家混合网络），参数量和处理的 tokens 数量分别增加了十倍和七倍，显示了技术上的重大突破和优化。这些优化不仅提升了系统的吞吐量，也降低了能耗。

在多模态方面，五月份开源的腾讯混元文生图大模型是全球首个中文原生 DiT 架构模型，也就是 Sora 带火的同款架构，生成效果相比上代提升超 20%。刘煜宏透露，在 Sora 出现之前，腾讯自研的视频生成能力在业内“遥遥领先”，但随着二月份那个惊奇演示之后，混元也随之更换了架构。如今，混元文生图大模型在 GitHub 累积了 2000+ star，前文也演示了元宝在这个文生图模型的加持下展示的创作能力。

GitHub：https://github/Tencent/HunyuanDiT

Hugging Face：https://huggingface.co/Tencent-Hunyuan/HunyuanDiT

此外，腾讯混元大模型在视频、3D 生成等方面也持续探索，目前已经支持 16s 视频生成，单图仅需 30 秒即可生成 3D 模型，相关能力也将于后续在元宝中上线，这点十分值得期待。

应用场景从哪找？

“腾讯做大模型不争一时之先。”

刘煜宏在沟通会上一直强调腾讯的“慢战略”，而这段时间，他们真正的工作是“看”，也就是洞察用户的真实需求。

自 2022 年 ChatGPT 发布以来，大模型领域异常火爆，频繁传出各种产品突破性进展的新闻。我们最经常看到的标题可能就是“超越 GPT-4”，“xx 评测榜单再度刷新” …… 但是，这股热潮被局限于一个“圈”内，并没有被普罗大众所感知到。

按照刘煜宏的说法，现在中国移动互联网有超过 12 亿的用户，其中不乏大量对互联网十分熟悉的群体，如大学生、互联网从业者和职场人士，这部分核心用户群体估计有数千万之众，然而大模型 AI 应用的实际日活跃用户（DAU）总量去除重复后，即使各家公司声称有数十万至数百万不等，综合起来也不过百万量级，这意味着在整个互联网用户群中的渗透率低至不足 1%。

通常的说法是“蓝海市场很大”，但我们也可以用两个字形容这种现象：“自嗨”。

对于广大普通用户而言，这些 AI 资讯显得相对遥远且缺乏实际感知。大模型仍在发展期，产品解决方案不成熟，且大家对 IA 应用的认知仍集中在搜索/效率（文本提炼、总结、创意文案）等比较窄的探索 —— 没人知道怎么用 AI。

刘煜宏透露，有很多企业高管对 AI 应用的第一想法还是“智能客服”。

沉寂了一年之久的混元，既不刷榜也不主动参加评测，而是慢慢的寻找却在 15 号突然全面开源了文生图大模型，后续参加了激烈的“国产大模型价格战”。

为什么腾讯会这么晚“参战”？其实，我们不需要考虑这个问题，答案事实上很简单：因为他是腾讯。

这家社交帝国除了火急火燎地追赶 OpenAI 以外，还有第二条路可走。依靠它在移动互联网时代打下的“江山”：微信、QQ 积累的庞大用户规模，从“跳一跳”开始火遍全国的小程序生态，无数公众号交织起来的优质内容宝库，甚至是腾讯视频正在热播、被用于元宝 App 演示的《庆余年 2》，都映现了这道江山的风貌。

现在，让混元大模型赋能这一切，就能立刻实现 Sam Altman 口中的那种“魔法”（Magic）。腾讯并不需要做出一个 SOTA，他们现在就可以端出一套完整的、基于移动互联网时代应用的“AI 生态”。

目前，腾讯内部有超过 600 个业务正式采用了混元大模型技术，日调用量已超过 2 亿次，这一数据早前就已经达到，并持续保持高位；相较于最初仅有少数产品尝试，实现了快速扩张。通过大模型的应用，腾讯内部提升了约 20% 的整体工作效率，特别是在代码生成方面，约有 23% 的代码是由 AI 自动生成的，省下了四分之一的人力。

腾讯的兵法，是“徐徐图之”。

开发者正在迎接新一轮的技术浪潮变革。由 CSDN 和高端 IT 咨询和教育平台 Boolan 联合主办的 2024 年度「全球软件研发技术大会」秉承干货实料（案例）的内容原则，将于 7 月 4 日-5 日在北京正式举办。大会共设置了 12 个大会主题：大模型智能应用开发、软件开发智能化、AI 与 ML 智能运维、云原生架构……详情👉：http://sdcon/

本文标签：腾讯上线模型正式业务

版权声明：本文标题：腾讯大模型 App 正式上线，全面接入微信 QQ 等 600+ 业务！内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1735058499h1696446.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

发表评论

全部评论 0

暂无评论

技术交流 – FreeNAS中文网

腾讯大模型 App 正式上线，全面接入微信 QQ 等 600+ 业务！

更多相关文章

16. 如何修改 SAP ABAP OData 模型，使其支持 $expand 操作

教你在本地部署AI大模型，效果很赞！

ChatGPT中文版正式上线，掀起人工智能语言生成新热潮

不会修改HuggingFace模型下载默认缓存路径？一篇教会你!

下载安装腾讯会议

用腾讯地图实现地点搜索

腾讯绿标域名什么价格？怎么认证？

腾讯千帆河洛上新日事清、微伴、新榜、腾讯企点、纷享销客、聚合数据、NPSMeter

OpenAI悄然发布最强模型o1：吊打GPT-4o

腾讯云总结

ddns客户端_NAS之路篇三：公网IP配合腾讯云DDNS实现外网访问NAS

淘宝京东商品长链接缩短为腾讯，新浪短链接的接口有哪些？

阿里 VS 腾讯：薪资大比拼

【大模型】ChatGPT API key 获取到代码集成使用详解

基于MLC LLM将Llama2-7B模型部署至Android手机运行

π0——用于通用机器人控制的VLA模型：一套框架控制7种机械臂(基于PaliGemma和流匹配的3B模型)

腾讯优图提出LAP无监督多视角人脸3D重建算法，高清还原面部细节

腾讯云DNSPod 已全面支持 DNSSEC啦～内含D妹抽奖！

ChatGPT模型常用参数设置(temperature, max_tokens, presence_penalty, frequency_penalty, top_p, n)

Windows修改huggingface模型下载地址

发表评论

推荐文章

jenkins 没有 pipeline_新Jenkins实践-第1章 开篇-为什么要做CICD？

计算机专业需要显示器吗,摄影人怎么选专业显示器，4K分辨率有必要吗？

解决SciencePlots找不到Noto Sans CJK SC问题

windows7搭建yum源的方法

纯净稳定的Windows7系统下载推荐

热门文章

Android抓包工具：Fiddler详解

数据名称：政府采购合同公告数据数据范围：全国时间范围：1996.6

大吉大利，求日期

如何录制视频微课？分享2款微课录制软件！

Win11系统提示找不到IpsPlugin.dll文件的解决办法

设置计算机系统语言,windows系统默认语言如何设置-windows系统默认语言设置方法 - 河东软件园...

百度文心一言对标 ChatGPT，你怎么看？

笔记本远程桌面连接台式机

如何擦除计算机连接网络的记录,电脑已经连接过的wifi热点怎么清除？电脑清除wifi热点记录的方法...

Windows11环境下MySQL安装

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

【Windows 11专业版】使用问题集合

Windows下搭建rtmp服务器

AzCopy – 上传下载 Windows Azure Blob 文件

windows11 搭建 WSL2 运行环境（2024）

windows安装多版本JDK

jenkins 没有 pipeline_新Jenkins实践-第1章开篇-为什么要做CICD？