在最近的大模型竞争中,OpenAI 似乎面临着维持霸主地位的挑战。尽管缺乏具体的数据统计,但自从 Claude 3.5 发布后,从网友们的评论中可以察觉到 OpenAI 订阅用户的流失:
“Claude 3.5 比 GPT-4o 更好用,为什么我们不去订阅 Claude 呢?”
在历时数月的批评声中,OpenAI 显得颇为颓势,除了推出 GPT-4o mini 这个小模型外,似乎再未有过显著的创新。甚至就在前几天,GPT-4o 还被开源的大模型所打败……
上周,外媒《The Information》预估 OpenAI 今年可能面临高达 50 亿美元的资金缺口,这无疑是个不利的信号。
不过,OpenAI 终于开启了模型反击战。
一夜之间,OpenAI 公布了两个重磅更新:
一个是 GPT-4o Voice Mode(语音模式)的开放小规模测试;另一个是 GPT-4o Long Output(长输出模型)。
语音模式迎来小范围测试,效果令人惊艳
今天凌晨,OpenAI 在推特上宣布了 GPT-4o Voice Mode 的开放测试。
他们将在订阅用户中挑选一部分进行 alpha 测试,这些用户将会在 APP 中收到相关通知和电子邮件。拥有 ChatGPT Plus 订阅的朋友们可以留意一下,如果你的 APP 收到了该消息,恭喜你,有机会参与语音模式的测试。
不过,有网友质疑:为什么在 5 月份预告的语音模式拖到了 7 月底才推出?OpenAI 回应称,他们“一直在努力提高语音的安全性和质量”,并承诺将在秋季向所有 Plus 订阅用户开放这项功能。
至于视频功能和屏幕共享功能,则需要再等一段时间。
然而!我只想问:为什么又是小范围开放测试?我也想体验啊啊啊……
不到几天,Twitter 和 YouTube 上已有很多用户分享了自己使用语音模式的感受,效果确实令人惊艳。
有网友希望 ChatGPT 成为一名法语教师,结果也得到了法语母语者的认可:这模型的语音发音真不赖啊!
另有网友测试了中文发音,调侃道“这声调怎么有点大佐味?难道这模型是……日本人?”好吧,这个发音确实超过了大多数外国人的水平,一个英文语音模型能做到这种程度已经相当不错了!
总之,模型反应迅速,大家都玩得很开心,有参与测试的朋友欢迎分享你们的体验!
实现 64k tokens 长输出,新模型定价高于原模型 GPT-4o
除了语音模式,OpenAI 官网还悄然开放了一个名为 GPT-4o Long Output 的 alpha 测试模型,该模型的测试时间将持续数周。
这个模型的一个主要特点是,输出 tokens 的上限大幅扩展,达到了 64k,相当于约 200 页小说的长度。与原型 GPT-4o 的 4000 个输出 tokens 相比,增加了整整 16 倍。
需要说明的是,这里提到的是输出 tokens 的上限,并不是最大上下文长度!最大上下文长度依然与 GPT-4o 相同,为 128k。
对于 GPT-4o 来说,它最多可以接受用户提供 124k 的输入 tokens,输出最大为 4k 个 tokens。而 GPT-4o Long Output 则需牺牲一些输入 tokens 的上限,最大输入为 64k tokens,换取可输出最大 64k tokens。
当被问及推出该模型的原因时,OpenAI 表示:“我们听到了客户的反馈,他们希望获得更长的输出上下文。我们一直在尝试新的方法,以更好地满足客户需求。”
值得注意的是,这个长输出模型的定价要比原模型略高:
每百万个输入 tokens 价格为 6 美元;每百万个输出 tokens 的费用则为 18 美元!
与 GPT-4o 模型的 15 美元每百万输出 tokens 相比,你们觉得这个价格合理吗?
此外,在 GPT-4o Long Output 的官方文档中,并未披露其他创新性变革,这意味着该长输出模型在生成质量上与原 GPT-4o 模型并无太大差距。
我有理由相信 OpenAI 还藏有更多的“干货”!为了维持用户的长期订阅,他们可能会将这些新功能分散发布,几个月放出一次(有时甚至还可以“反击”竞争对手),这真是一招妙棋!
现在,我的心态是:静候 GPT-5 的消息!不过,请不要再搞什么“候补名单”或“小范围测试”了!