重磅惊喜！OpenAI突然上线GPT-4o超长输出模型！「Her」高级语音模式已开放测试！

在最近的大模型竞争中，OpenAI 似乎面临着维持霸主地位的挑战。尽管缺乏具体的数据统计，但自从 Claude 3.5 发布后，从网友们的评论中可以察觉到 OpenAI 订阅用户的流失：

“Claude 3.5 比 GPT-4o 更好用，为什么我们不去订阅 Claude 呢？”

在历时数月的批评声中，OpenAI 显得颇为颓势，除了推出 GPT-4o mini 这个小模型外，似乎再未有过显著的创新。甚至就在前几天，GPT-4o 还被开源的大模型所打败……

上周，外媒《The Information》预估 OpenAI 今年可能面临高达 50 亿美元的资金缺口，这无疑是个不利的信号。

不过，OpenAI 终于开启了模型反击战。

一夜之间，OpenAI 公布了两个重磅更新：

一个是 GPT-4o Voice Mode（语音模式）的开放小规模测试；另一个是 GPT-4o Long Output（长输出模型）。

语音模式迎来小范围测试，效果令人惊艳

今天凌晨，OpenAI 在推特上宣布了 GPT-4o Voice Mode 的开放测试。

他们将在订阅用户中挑选一部分进行 alpha 测试，这些用户将会在 APP 中收到相关通知和电子邮件。拥有 ChatGPT Plus 订阅的朋友们可以留意一下，如果你的 APP 收到了该消息，恭喜你，有机会参与语音模式的测试。

不过，有网友质疑：为什么在 5 月份预告的语音模式拖到了 7 月底才推出？OpenAI 回应称，他们“一直在努力提高语音的安全性和质量”，并承诺将在秋季向所有 Plus 订阅用户开放这项功能。

至于视频功能和屏幕共享功能，则需要再等一段时间。

然而！我只想问：为什么又是小范围开放测试？我也想体验啊啊啊……

不到几天，Twitter 和 YouTube 上已有很多用户分享了自己使用语音模式的感受，效果确实令人惊艳。

有网友希望 ChatGPT 成为一名法语教师，结果也得到了法语母语者的认可：这模型的语音发音真不赖啊！

另有网友测试了中文发音，调侃道“这声调怎么有点大佐味？难道这模型是……日本人？”好吧，这个发音确实超过了大多数外国人的水平，一个英文语音模型能做到这种程度已经相当不错了！

总之，模型反应迅速，大家都玩得很开心，有参与测试的朋友欢迎分享你们的体验！

实现 64k tokens 长输出，新模型定价高于原模型 GPT-4o

除了语音模式，OpenAI 官网还悄然开放了一个名为 GPT-4o Long Output 的 alpha 测试模型，该模型的测试时间将持续数周。

这个模型的一个主要特点是，输出 tokens 的上限大幅扩展，达到了 64k，相当于约 200 页小说的长度。与原型 GPT-4o 的 4000 个输出 tokens 相比，增加了整整 16 倍。

需要说明的是，这里提到的是输出 tokens 的上限，并不是最大上下文长度！最大上下文长度依然与 GPT-4o 相同，为 128k。

对于 GPT-4o 来说，它最多可以接受用户提供 124k 的输入 tokens，输出最大为 4k 个 tokens。而 GPT-4o Long Output 则需牺牲一些输入 tokens 的上限，最大输入为 64k tokens，换取可输出最大 64k tokens。

当被问及推出该模型的原因时，OpenAI 表示：“我们听到了客户的反馈，他们希望获得更长的输出上下文。我们一直在尝试新的方法，以更好地满足客户需求。”

值得注意的是，这个长输出模型的定价要比原模型略高：

每百万个输入 tokens 价格为 6 美元；每百万个输出 tokens 的费用则为 18 美元！

与 GPT-4o 模型的 15 美元每百万输出 tokens 相比，你们觉得这个价格合理吗？

此外，在 GPT-4o Long Output 的官方文档中，并未披露其他创新性变革，这意味着该长输出模型在生成质量上与原 GPT-4o 模型并无太大差距。

我有理由相信 OpenAI 还藏有更多的“干货”！为了维持用户的长期订阅，他们可能会将这些新功能分散发布，几个月放出一次（有时甚至还可以“反击”竞争对手），这真是一招妙棋！

现在，我的心态是：静候 GPT-5 的消息！不过，请不要再搞什么“候补名单”或“小范围测试”了！

相关文章