重磅惊喜!OpenAI突然上线GPT-4o超长输出模型!「Her」高级语音模式已开放测试!

在最近的大模型竞争中,OpenAI 似乎面临着维持霸主地位的挑战。尽管缺乏具体的数据统计,但自从 Claude 3.5 发布后,从网友们的评论中可以察觉到 OpenAI 订阅用户的流失:

“Claude 3.5 比 GPT-4o 更好用,为什么我们不去订阅 Claude 呢?”

在历时数月的批评声中,OpenAI 显得颇为颓势,除了推出 GPT-4o mini 这个小模型外,似乎再未有过显著的创新。甚至就在前几天,GPT-4o 还被开源的大模型所打败……

上周,外媒《The Information》预估 OpenAI 今年可能面临高达 50 亿美元的资金缺口,这无疑是个不利的信号。

不过,OpenAI 终于开启了模型反击战。

一夜之间,OpenAI 公布了两个重磅更新:

一个是 GPT-4o Voice Mode(语音模式)的开放小规模测试;另一个是 GPT-4o Long Output(长输出模型)。

语音模式迎来小范围测试,效果令人惊艳

今天凌晨,OpenAI 在推特上宣布了 GPT-4o Voice Mode 的开放测试。

他们将在订阅用户中挑选一部分进行 alpha 测试,这些用户将会在 APP 中收到相关通知和电子邮件。拥有 ChatGPT Plus 订阅的朋友们可以留意一下,如果你的 APP 收到了该消息,恭喜你,有机会参与语音模式的测试。

不过,有网友质疑:为什么在 5 月份预告的语音模式拖到了 7 月底才推出?OpenAI 回应称,他们“一直在努力提高语音的安全性和质量”,并承诺将在秋季向所有 Plus 订阅用户开放这项功能。

至于视频功能和屏幕共享功能,则需要再等一段时间。

然而!我只想问:为什么又是小范围开放测试?我也想体验啊啊啊……

不到几天,Twitter 和 YouTube 上已有很多用户分享了自己使用语音模式的感受,效果确实令人惊艳。

有网友希望 ChatGPT 成为一名法语教师,结果也得到了法语母语者的认可:这模型的语音发音真不赖啊!

另有网友测试了中文发音,调侃道“这声调怎么有点大佐味?难道这模型是……日本人?”好吧,这个发音确实超过了大多数外国人的水平,一个英文语音模型能做到这种程度已经相当不错了!

总之,模型反应迅速,大家都玩得很开心,有参与测试的朋友欢迎分享你们的体验!

实现 64k tokens 长输出,新模型定价高于原模型 GPT-4o

除了语音模式,OpenAI 官网还悄然开放了一个名为 GPT-4o Long Output 的 alpha 测试模型,该模型的测试时间将持续数周。

这个模型的一个主要特点是,输出 tokens 的上限大幅扩展,达到了 64k,相当于约 200 页小说的长度。与原型 GPT-4o 的 4000 个输出 tokens 相比,增加了整整 16 倍。

需要说明的是,这里提到的是输出 tokens 的上限,并不是最大上下文长度!最大上下文长度依然与 GPT-4o 相同,为 128k。

对于 GPT-4o 来说,它最多可以接受用户提供 124k 的输入 tokens,输出最大为 4k 个 tokens。而 GPT-4o Long Output 则需牺牲一些输入 tokens 的上限,最大输入为 64k tokens,换取可输出最大 64k tokens。

当被问及推出该模型的原因时,OpenAI 表示:“我们听到了客户的反馈,他们希望获得更长的输出上下文。我们一直在尝试新的方法,以更好地满足客户需求。”

值得注意的是,这个长输出模型的定价要比原模型略高:

每百万个输入 tokens 价格为 6 美元;每百万个输出 tokens 的费用则为 18 美元!

与 GPT-4o 模型的 15 美元每百万输出 tokens 相比,你们觉得这个价格合理吗?

此外,在 GPT-4o Long Output 的官方文档中,并未披露其他创新性变革,这意味着该长输出模型在生成质量上与原 GPT-4o 模型并无太大差距。

我有理由相信 OpenAI 还藏有更多的“干货”!为了维持用户的长期订阅,他们可能会将这些新功能分散发布,几个月放出一次(有时甚至还可以“反击”竞争对手),这真是一招妙棋!

现在,我的心态是:静候 GPT-5 的消息!不过,请不要再搞什么“候补名单”或“小范围测试”了!

滚动至顶部