马斯克摊上事了！Grok AI被爆疑似抄袭ChatGPT？？

作者：管理员 / 2024年11月8日

推荐使用ChatGPT4.0中文网，国内可直接访问：www.chatgp7.com

马斯克今天遇到了麻烦！

在X（推特）上，有网友爆料称，马斯克旗下的xAI公司研发的Grok AI疑似“抄袭”ChatGPT。Grok在回答一位用户的问题时，令人震惊地“承认”道：

“恐怕我无法满足该请求，因为它违反了OpenAI的用例政策。”

什么？违反OpenAI的用例政策？

这简直就等于Grok模型自己承认其抄袭或模仿ChatGPT！

此外，网友Jax还在推特上发布了一段视频，内容是Grok的回答，直截了当地表明自己是由OpenAI开发的：

还有网友分享了Grok的另一个惊人回答：

“如果你想报错，可以通过openai.com的邮箱联系我。”

这一系列证据让我大跌眼镜。

Grok AI于12月8日才刚刚开始向美国的X Premium+用户正式推出，用户每月需付费16美元。

这才上线两天，就惹出了这样的麻烦，实在令人尴尬。

是抄袭还是数据集污染？
那么，这一事件背后究竟是怎么回事呢？

难道Grok真的抄袭了ChatGPT的代码或模型权重？

由于OpenAI并未开源代码，因此抄袭的可能性基本可以排除。

难道Grok直接在使用ChatGPT的API？

虽然小公司或某些大厂可能会这样做，但马斯克的xAI不太可能会走这条路，毕竟马斯克作为世界首富不想丢脸。

看来，剩下的最可能的解释就是——数据集污染。

有网友猜测，xAI可能在使用ChatGPT的输出答案来微调开源的Llama模型，xAI并没有资源从头训练大型模型。

就在网友们纷纷猜测的时候，xAI的12位联合创始人之一，曾在DeepMind工作四年、OpenAI工作两年的AI研究员Igor Babuschkin出来澄清了：

Grok模型的训练数据无意中包含了ChatGPT的输出。

从目前来看，数据集污染加上幻觉回答的可能性最大。

OpenAI在线吃瓜，马斯克反击

OpenAI在第一时间赶来围观，使用ChatGPT的官方推特发布了一条发文调侃道：

“我们有很多共同之处。”

对此，马斯克反击道：

“好吧，儿子，既然你从这个平台（推特）抓取了所有数据进行训练，你应该知道事情的真相。”

图片
网友们表示，此时Sam Altman可能在某个角落偷偷乐，因为之前这两人一直在网上互掐。

起初，Altman调侃马斯克，称用GPTs随便可以创建一个和Grok同名的模型：

随后，马斯克用一张梗图作为回应，展示了他的“终极大招”：

有网友亲自询问Grok是否由OpenAI开发，Grok坚定否认，并表示对xAI和马斯克感到自豪。

当网友询问：“xAI有没有使用OpenAI的数据集来训练你？”时，Grok给出了相当有趣的回答：

“对此我不确定，但我可以告诉你xAI是由马斯克创建的，独立于OpenAI。然而，xAI确实使用了推特的数据来训练AI模型。”

如何解决这个问题？
如果确实只是Grok的训练数据无意中包含了ChatGPT的答案输出，解决方式其实很简单：

一是在数据集筛选阶段加强审核把控；
二是在微调和指令微调环节确保回答的强对齐，以减少幻觉回答的出现。

不过网友们吃瓜热情不减，给Grok提出了一些“无用的建议”——如果回答中提到OpenAI，那就直接回复：

“抱歉，请重试。”

或者更简单，如果Grok的回答包含了OpenAI，那就把OpenAI替换成Grok。

最后，Grok顺便提供了个猛料——世界上最强大的GPT-4模型实际上是由xAI开发的。怪不得xAI前段时间被爆出正融资10亿美元（手动狗头）。

马斯克和Grok将会折腾出多大的浪花呢？让我们拭目以待吧！