OpenAI于周二通过Twitter宣布,本周起将面向Plus和Teams级别的订阅用户推出其先进的高级语音功能,并新增五种对话式AI的声音。企业用户和教育订阅者则将于下周开始获得使用权限。
Advanced Voice功能依托于GPT-4o模型,使用户能够摆脱书面文本输入的束缚,直接与聊天机器人进行对话,仿佛与真人交流一般。该功能最初在OpenAI的春季更新活动中揭晓,并于7月面向部分精选的ChatGPT Plus订阅者开放,以进行Beta测试。如今,所有付费订阅者均可亲身体验这一创新功能。
同时,OpenAI还为聊天机器人推出了五种全新的声音:Arbor、Maple、Sol、Spruce和Vale(您现已可在线试听)。这些声音将提供标准和高级两种语音模式,进一步丰富了ChatGPT原有的四种声音选项——Breeze、Juniper、Cove和Ember。OpenAI还透露,尽管目前高级语音功能尚不支持视频和屏幕共享,但这些功能将在未来逐步推出。
此外,OpenAI还整合了两项工具,旨在使Advanced Voice功能更加贴近传统的文本聊天机器人体验:记忆功能和自定义指令。Advanced Voice在初次亮相时,仅能引用当前聊天会话中的信息。而现在,借助记忆功能,AI能够回忆起过往对话中的细节,从而减少了用户的重复输入。同样地,自定义指令功能允许用户为模型在生成响应时设定基本规则。例如,您可以指定所有基于编程的响应均应以Python语言呈现。
当该功能在用户的账户中上线时,Plus和Teams订阅者将收到应用内的通知提醒。然而,遗憾的是,Advanced Voice功能目前暂不支持欧盟、英国、瑞士、冰岛、挪威和列支敦士登等地区的用户使用。
值得一提的是,ChatGPT并非唯一一款能够直接与用户进行对话的人工智能产品。在周二公告发布前的短短两周内,谷歌已向所有用户(包括免费用户)推出了Gemini Live服务。