admin 管理员组文章数量: 887016
大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,专注于分享AI全维度知识,包括但不限于AI科普,AI工具测评,AI效率提升,AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。
1. 什么是ChatGPT实时语音功能?
ChatGPT实时语音功能(Advanced Voice Mode)最早亮相于OpenAI 2024年5月13日的春季直播发布会,与GPT-4o
模型同时发布。但随后的4个多月中,该功能一直处于alpha内测阶段,仅有少部分参与内测的用户有体验权限。而就在昨天,OpenAI官方宣布,ChatGPT实时语音功能将在本周内向所有ChatGPT Plus和Team会员用户推送。说是“本周”,但实际上我周围的很多小伙伴当天就收到了这一新功能的推送。
相较于之前的标准语音,高级语音功能利用了GPT-4o
模型的原生音频能力(多模态),提供更加自然、实时的类似于真人之间的对话体验,甚至可以识别非语言细节(例如你说话的速度)并带有情感地回应。
关于该功能的详细视频介绍可以看我的这篇文章:《春日暖阳,何不来看一场OpenAI的发布会》。
2. 如何使用ChatGPT实时语音功能?
目前ChatGPT实时语音功能仅对付费会员开放,所以想要体验该功能需要满足两个条件:一是一个ChatGPT账号,二是开通ChatGPT Plus或者Team会员。
需注意的是,个人用户推荐开通ChatGPT Plus会员就可以,价格不算便宜(20美元每月),需要确认好自己的需求。如果只是想体验玩玩,可以选择国内的智谱清言或者阿里通义千问。
3. 开通了Plus会员还是没有看到实时语音功能?
有可能是还没被推送到,这种情况等待即可,本周肯定都能推送到。
在等待的同时可以按照下面的方法自检一下。
首先在iOS App Store或者谷歌Play Store确认把ChatGPT app升级到最新版本(1.2024.261
版本及以后)。其次,确认一下自己的上网环境,最好将IP切换至美国。最后,退出ChatGPT账号然后重新登录。
4. ChatGPT实时语音功能可以在哪些设备使用?
目前ChatGPT实时语音功能仅支持移动端,即iOS或安卓ChatGPT app中使用。macOS端有小伙伴反应还没有推送到。
浏览器网页端则是连标准语音功能都不支持,更不用说实时语音功能。
5. 实时语音功能在哪些国家可用?
OpenAI明确表示,ChatGPT实时语音功能尚未在欧盟、英国、瑞士、冰岛、挪威和列支敦士登开放。
6. 如何开始语音对话?
在ChatGPT app内点击右下角(输入框右侧)的语音按钮,即可进入语音对话模式。
如果是实时语音模式,你会在页面中心看到一个蓝色的圆球。
如果是传统的标准语音模式(标准语音模式对所有用户开放,包括免费用户),页面中心会有一个黑色的圆圈。
7. 有多少种声音选项可供选择?
ChatGPT实时语音功能提供共计9种声音供你选择,每种声音都有其独特的语调和性格。
-
Arbor - 随和且多才多艺
-
Breeze - 生动且真诚
-
Cove - 沉着且直接
-
Ember - 自信且乐观
-
Juniper - 开朗且积极
-
Maple - 活泼且坦率
-
Sol - 聪慧且放松
-
Spruce - 平静且充满肯定
-
Vale - 明亮且好奇
8. 实时语音聊天时长有限制吗?
OpenAI明确强调,ChatGPT Plus和Team用户的实时语音模式每天有使用时长的限制,且每日限制可能会变化(和高级模型类似,会随着当前资源动态调整)。当你快要达到每日的使用上限前15分钟,ChatGPT会发出如下的通知提醒。
一旦达到实时语音模式的每日限制,对话将立即结束,随后你可以切换到标准语音模式继续语音聊天。标准语音与生成响应所使用的基础模型共享消息限制,这意味着,如果你在标准语音模式下使用GPT-4o
来和ChatGPT对话,它将会占用你GPT-4o
的使用额度。
当前ChatGPT Plus会员能够使用无限次数的GPT-4o mini
模型,80次/3小时的GPT-4o
模型,以及40次/3小时的GPT-4 Turbo
模型。标准语音模式将消耗这些额度。
9. 可以在后台或锁屏时继续语音对话吗?
可以,在ChatGPT app-设置
中启用后台对话(Background Conversations)
功能,你就可以在后台或者锁屏状态下继续语音对话。
但是结合上一条限制来看,一天24小时在后台开着ChatGPT语音模式并不可行,因为有着聊天时长的限制。
10. ChatGPT实时语音功能能视频聊天吗?
目前不可以。虽然在发布会中OpenAI的研究人员展示的是能够进行视频聊天(ChatGPT通过摄像头识别视频中的内容),但当前的ChatGPT实时语音功能还没有实时视频功能,算是“阉割版”。
11. 可以与GPTs进行实时语音对话吗?
不可以。GPTs目前暂不支持实时语音功能,仅支持标准语音对话。与前面介绍的ChatGPT的9种输出声音不同,GPTs有自己独特的语音选项,名为Shimmer。
12. 可以通过语音对话生成音乐内容吗?
不可以。OpenAI设置了多个过滤措施,以防止语音对话生成包括演唱在内的音乐内容。
13.如果降级为ChatGPT免费账户,还能使用实时语音功能吗?
不可以。实时语音对话仅对Plus和Team付费用户开放。
14. OpenAI会保留语音对话中的音频多长时间?
在实时语音对话模式下,音频片段与对话历史中的转录内容会一起存储。对话历史中会有一个音频icon,表明该对话是在实时语音模式下进行的:可以看到灰色的文字和一个小麦克风图标。
实时语音对话的音频片段会与对话历史一起保留。如果你删除对话,OpenAI将在30天内删除相关的音频片段,除非出于安全或法律原因需要保留,或者你已与OpenAI分享过这些音频片段用于模型训练,而这些音频片段已与你的账户解除关联。
一旦删除对话,无法恢复。如果你希望从聊天历史中删除对话(但对话内容仍保留在账户中),可以使用归档功能。归档的对话相关音频片段也会被保留。
在标准语音模式下,音频片段在生成响应之前会被转录。一旦转录完成,音频片段将被删除,除非你选择分享音频片段来训练模型。
15. OpenAI会使用语音对话中的音频来训练模型吗?
不会,除非你选择分享语音对话中的音频片段以训练模型。
如果你启用了“为所有人改进模型”选项,那么OpenAI可能会使用语音对话的转录内容来训练模型,但不会使用相关的音频片段。
精选推荐
都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。
版权声明:本文标题:关于ChatGPT实时语音功能,你需要知道的15点总结! 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.freenas.com.cn/jishu/1728209636h1213743.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论