admin 管理员组

文章数量: 887016

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。

1. 什么是ChatGPT实时语音功能?

ChatGPT实时语音功能Advanced Voice Mode)最早亮相于OpenAI 2024年5月13日的春季直播发布会,与GPT-4o模型同时发布。但随后的4个多月中,该功能一直处于alpha内测阶段,仅有少部分参与内测的用户有体验权限。而就在昨天,OpenAI官方宣布,ChatGPT实时语音功能将在本周内向所有ChatGPT Plus和Team会员用户推送。说是“本周”,但实际上我周围的很多小伙伴当天就收到了这一新功能的推送。

相较于之前的标准语音,高级语音功能利用了GPT-4o模型的原生音频能力(多模态),提供更加自然、实时的类似于真人之间的对话体验,甚至可以识别非语言细节(例如你说话的速度)并带有情感地回应。

关于该功能的详细视频介绍可以看我的这篇文章:《春日暖阳,何不来看一场OpenAI的发布会》。

2. 如何使用ChatGPT实时语音功能?

目前ChatGPT实时语音功能仅对付费会员开放,所以想要体验该功能需要满足两个条件:一是一个ChatGPT账号,二是开通ChatGPT Plus或者Team会员。

需注意的是,个人用户推荐开通ChatGPT Plus会员就可以,价格不算便宜(20美元每月),需要确认好自己的需求。如果只是想体验玩玩,可以选择国内的智谱清言或者阿里通义千问。

3. 开通了Plus会员还是没有看到实时语音功能?

有可能是还没被推送到,这种情况等待即可,本周肯定都能推送到。

在等待的同时可以按照下面的方法自检一下。

首先在iOS App Store或者谷歌Play Store确认把ChatGPT app升级到最新版本(1.2024.261版本及以后)。其次,确认一下自己的上网环境,最好将IP切换至美国。最后,退出ChatGPT账号然后重新登录。

4. ChatGPT实时语音功能可以在哪些设备使用?

目前ChatGPT实时语音功能仅支持移动端,即iOS或安卓ChatGPT app中使用。macOS端有小伙伴反应还没有推送到。

浏览器网页端则是连标准语音功能都不支持,更不用说实时语音功能。

5. 实时语音功能在哪些国家可用?

OpenAI明确表示,ChatGPT实时语音功能尚未在欧盟、英国、瑞士、冰岛、挪威和列支敦士登开放。

6. 如何开始语音对话?

在ChatGPT app内点击右下角(输入框右侧)的语音按钮,即可进入语音对话模式。

如果是实时语音模式,你会在页面中心看到一个蓝色的圆球。

如果是传统的标准语音模式(标准语音模式对所有用户开放,包括免费用户),页面中心会有一个黑色的圆圈。

7. 有多少种声音选项可供选择?

ChatGPT实时语音功能提供共计9种声音供你选择,每种声音都有其独特的语调和性格。

  1. Arbor - 随和且多才多艺

  2. Breeze - 生动且真诚

  3. Cove - 沉着且直接

  4. Ember - 自信且乐观

  5. Juniper - 开朗且积极

  6. Maple - 活泼且坦率

  7. Sol - 聪慧且放松

  8. Spruce - 平静且充满肯定

  9. Vale - 明亮且好奇

8. 实时语音聊天时长有限制吗?

OpenAI明确强调,ChatGPT Plus和Team用户的实时语音模式每天有使用时长的限制,且每日限制可能会变化(和高级模型类似,会随着当前资源动态调整)。当你快要达到每日的使用上限前15分钟,ChatGPT会发出如下的通知提醒。

一旦达到实时语音模式的每日限制,对话将立即结束,随后你可以切换到标准语音模式继续语音聊天。标准语音与生成响应所使用的基础模型共享消息限制,这意味着,如果你在标准语音模式下使用GPT-4o来和ChatGPT对话,它将会占用你GPT-4o的使用额度。

当前ChatGPT Plus会员能够使用无限次数的GPT-4o mini模型,80次/3小时的GPT-4o模型,以及40次/3小时的GPT-4 Turbo模型。标准语音模式将消耗这些额度。

9. 可以在后台或锁屏时继续语音对话吗?

可以,在ChatGPT app-设置中启用后台对话(Background Conversations)功能,你就可以在后台或者锁屏状态下继续语音对话。

但是结合上一条限制来看,一天24小时在后台开着ChatGPT语音模式并不可行,因为有着聊天时长的限制。

10. ChatGPT实时语音功能能视频聊天吗?

目前不可以。虽然在发布会中OpenAI的研究人员展示的是能够进行视频聊天(ChatGPT通过摄像头识别视频中的内容),但当前的ChatGPT实时语音功能还没有实时视频功能,算是“阉割版”。

11. 可以与GPTs进行实时语音对话吗?

不可以。GPTs目前暂不支持实时语音功能,仅支持标准语音对话。与前面介绍的ChatGPT的9种输出声音不同,GPTs有自己独特的语音选项,名为Shimmer。

12. 可以通过语音对话生成音乐内容吗?

不可以。OpenAI设置了多个过滤措施,以防止语音对话生成包括演唱在内的音乐内容。

13.如果降级为ChatGPT免费账户,还能使用实时语音功能吗?

不可以。实时语音对话仅对Plus和Team付费用户开放。

14. OpenAI会保留语音对话中的音频多长时间?

在实时语音对话模式下,音频片段与对话历史中的转录内容会一起存储。对话历史中会有一个音频icon,表明该对话是在实时语音模式下进行的:可以看到灰色的文字和一个小麦克风图标。

实时语音对话的音频片段会与对话历史一起保留。如果你删除对话,OpenAI将在30天内删除相关的音频片段,除非出于安全或法律原因需要保留,或者你已与OpenAI分享过这些音频片段用于模型训练,而这些音频片段已与你的账户解除关联。

一旦删除对话,无法恢复。如果你希望从聊天历史中删除对话(但对话内容仍保留在账户中),可以使用归档功能。归档的对话相关音频片段也会被保留。

在标准语音模式下,音频片段在生成响应之前会被转录。一旦转录完成,音频片段将被删除,除非你选择分享音频片段来训练模型。

15. OpenAI会使用语音对话中的音频来训练模型吗?

不会,除非你选择分享语音对话中的音频片段以训练模型。

如果你启用了“为所有人改进模型”选项,那么OpenAI可能会使用语音对话的转录内容来训练模型,但不会使用相关的音频片段。


精选推荐


都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。

本文标签: 实时 语音 功能 ChatGpt