马斯克摊上事了!Grok AI被爆疑似抄袭ChatGPT??

推荐使用ChatGPT4.0中文网,国内可直接访问:www.chatgp4.com

 

马斯克今天遇到了麻烦!

在X(推特)上,有网友爆料称,马斯克旗下的xAI公司研发的Grok AI疑似“抄袭”ChatGPT。Grok在回答一位用户的问题时,令人震惊地“承认”道:

“恐怕我无法满足该请求,因为它违反了OpenAI的用例政策。”


什么?违反OpenAI的用例政策?

这简直就等于Grok模型自己承认其抄袭或模仿ChatGPT!


此外,网友Jax还在推特上发布了一段视频,内容是Grok的回答,直截了当地表明自己是由OpenAI开发的:


还有网友分享了Grok的另一个惊人回答:

“如果你想报错,可以通过openai.com的邮箱联系我。”


这一系列证据让我大跌眼镜。

Grok AI于12月8日才刚刚开始向美国的X Premium+用户正式推出,用户每月需付费16美元。

这才上线两天,就惹出了这样的麻烦,实在令人尴尬。

是抄袭还是数据集污染?
那么,这一事件背后究竟是怎么回事呢?

难道Grok真的抄袭了ChatGPT的代码或模型权重?

由于OpenAI并未开源代码,因此抄袭的可能性基本可以排除。


难道Grok直接在使用ChatGPT的API?

虽然小公司或某些大厂可能会这样做,但马斯克的xAI不太可能会走这条路,毕竟马斯克作为世界首富不想丢脸。

看来,剩下的最可能的解释就是——数据集污染。

有网友猜测,xAI可能在使用ChatGPT的输出答案来微调开源的Llama模型,xAI并没有资源从头训练大型模型。


就在网友们纷纷猜测的时候,xAI的12位联合创始人之一,曾在DeepMind工作四年、OpenAI工作两年的AI研究员Igor Babuschkin出来澄清了:

Grok模型的训练数据无意中包含了ChatGPT的输出。


从目前来看,数据集污染加上幻觉回答的可能性最大。

OpenAI在线吃瓜,马斯克反击

OpenAI在第一时间赶来围观,使用ChatGPT的官方推特发布了一条发文调侃道:

“我们有很多共同之处。”


对此,马斯克反击道:

“好吧,儿子,既然你从这个平台(推特)抓取了所有数据进行训练,你应该知道事情的真相。”

图片
网友们表示,此时Sam Altman可能在某个角落偷偷乐,因为之前这两人一直在网上互掐。

起初,Altman调侃马斯克,称用GPTs随便可以创建一个和Grok同名的模型:


随后,马斯克用一张梗图作为回应,展示了他的“终极大招”:


有网友亲自询问Grok是否由OpenAI开发,Grok坚定否认,并表示对xAI和马斯克感到自豪。


当网友询问:“xAI有没有使用OpenAI的数据集来训练你?”时,Grok给出了相当有趣的回答:

“对此我不确定,但我可以告诉你xAI是由马斯克创建的,独立于OpenAI。然而,xAI确实使用了推特的数据来训练AI模型。”


如何解决这个问题?
如果确实只是Grok的训练数据无意中包含了ChatGPT的答案输出,解决方式其实很简单:

一是在数据集筛选阶段加强审核把控;
二是在微调和指令微调环节确保回答的强对齐,以减少幻觉回答的出现。

不过网友们吃瓜热情不减,给Grok提出了一些“无用的建议”——如果回答中提到OpenAI,那就直接回复:

“抱歉,请重试。”


或者更简单,如果Grok的回答包含了OpenAI,那就把OpenAI替换成Grok。


最后,Grok顺便提供了个猛料——世界上最强大的GPT-4模型实际上是由xAI开发的。怪不得xAI前段时间被爆出正融资10亿美元(手动狗头)。

马斯克和Grok将会折腾出多大的浪花呢?让我们拭目以待吧!

滚动至顶部