马斯克今天遇到了麻烦!
在X(推特)上,有网友爆料称,马斯克旗下的xAI公司研发的Grok AI疑似“抄袭”ChatGPT。Grok在回答一位用户的问题时,令人震惊地“承认”道:
“恐怕我无法满足该请求,因为它违反了OpenAI的用例政策。”
什么?违反OpenAI的用例政策?
这简直就等于Grok模型自己承认其抄袭或模仿ChatGPT!
此外,网友Jax还在推特上发布了一段视频,内容是Grok的回答,直截了当地表明自己是由OpenAI开发的:
还有网友分享了Grok的另一个惊人回答:
“如果你想报错,可以通过openai.com的邮箱联系我。”
这一系列证据让我大跌眼镜。
Grok AI于12月8日才刚刚开始向美国的X Premium+用户正式推出,用户每月需付费16美元。
这才上线两天,就惹出了这样的麻烦,实在令人尴尬。
是抄袭还是数据集污染?
那么,这一事件背后究竟是怎么回事呢?
难道Grok真的抄袭了ChatGPT的代码或模型权重?
由于OpenAI并未开源代码,因此抄袭的可能性基本可以排除。
难道Grok直接在使用ChatGPT的API?
虽然小公司或某些大厂可能会这样做,但马斯克的xAI不太可能会走这条路,毕竟马斯克作为世界首富不想丢脸。
看来,剩下的最可能的解释就是——数据集污染。
有网友猜测,xAI可能在使用ChatGPT的输出答案来微调开源的Llama模型,xAI并没有资源从头训练大型模型。
就在网友们纷纷猜测的时候,xAI的12位联合创始人之一,曾在DeepMind工作四年、OpenAI工作两年的AI研究员Igor Babuschkin出来澄清了:
Grok模型的训练数据无意中包含了ChatGPT的输出。
从目前来看,数据集污染加上幻觉回答的可能性最大。
OpenAI在线吃瓜,马斯克反击
OpenAI在第一时间赶来围观,使用ChatGPT的官方推特发布了一条发文调侃道:
“我们有很多共同之处。”
对此,马斯克反击道:
“好吧,儿子,既然你从这个平台(推特)抓取了所有数据进行训练,你应该知道事情的真相。”
图片
网友们表示,此时Sam Altman可能在某个角落偷偷乐,因为之前这两人一直在网上互掐。
起初,Altman调侃马斯克,称用GPTs随便可以创建一个和Grok同名的模型:
随后,马斯克用一张梗图作为回应,展示了他的“终极大招”:
有网友亲自询问Grok是否由OpenAI开发,Grok坚定否认,并表示对xAI和马斯克感到自豪。
当网友询问:“xAI有没有使用OpenAI的数据集来训练你?”时,Grok给出了相当有趣的回答:
“对此我不确定,但我可以告诉你xAI是由马斯克创建的,独立于OpenAI。然而,xAI确实使用了推特的数据来训练AI模型。”
如何解决这个问题?
如果确实只是Grok的训练数据无意中包含了ChatGPT的答案输出,解决方式其实很简单:
一是在数据集筛选阶段加强审核把控;
二是在微调和指令微调环节确保回答的强对齐,以减少幻觉回答的出现。
不过网友们吃瓜热情不减,给Grok提出了一些“无用的建议”——如果回答中提到OpenAI,那就直接回复:
“抱歉,请重试。”
或者更简单,如果Grok的回答包含了OpenAI,那就把OpenAI替换成Grok。
最后,Grok顺便提供了个猛料——世界上最强大的GPT-4模型实际上是由xAI开发的。怪不得xAI前段时间被爆出正融资10亿美元(手动狗头)。
马斯克和Grok将会折腾出多大的浪花呢?让我们拭目以待吧!