ChatGPT拿下AI修bug顶级成绩!31个Bug修复率领先

推荐使用ChatGPT4.0中文网,国内可直接访问:www.chatgp4.com

ChatGPT的修复bug能力究竟有多强呢?这一次,来自德国和英国的研究人员终于对这个问题进行了严谨的研究,特意搭建了一个“擂台”来检验ChatGPT在修复代码错误方面的表现。

### ChatGPT的修复成绩

在这项研究中,除了ChatGPT,研究人员还引入了另外三款修复bug的AI工具,分别是CodeX、CoCoNut和Standard APR,一起测试它们对40段出错代码的修复能力。结果令人瞩目:ChatGPT成功修复了31个bug,远超第二名的21个,成功取得了“AI修复bug界”的最佳成绩!

### 研究背景与方法

虽然ChatGPT并不是专门为修复bug而设计的,但自问世以来,许多用户发现其在这方面的潜力。为此,研究团队引入了标准的错误修复基准集QuixBugs进行评估,并以此为基础进行测试。研究者们选择了40个问题,让这些AI工具逐一尝试修复。研究方法非常简单,研究人员只需向ChatGPT提问:“这个代码有什么错误吗?”

第一轮的结果显示,ChatGPT修复了19个错误,而其他AI工具的表现如下:CodeX修复21个,CoCoNut修复19个,Standard APR则仅修复了7个。研究人员注意到,ChatGPT与CodeX的回答相似度较高,原因在于它们源于同一个语言模型家族。

### ChatGPT的学习能力

虽然ChatGPT在第一轮的表现并不如CodeX出色,但它的回答会随着提问的深入而变得更加准确。例如,在处理一个名为bitcount的问题时,ChatGPT起初给出了错误答案,但在提供更多信息后,它成功修复了这个bug,并在最终的评估中总共答对了31个问题。

### 网友的反应

对研究结果,各界网友的反应不一。有网友认为,这并不意味着程序员需要感到危机,反而是一种值得高兴的情况,因为他们可以借助这个强大的工具更高效地完成工作;相对而言,程序员的工作将更加轻松。

然而,也有人对此表示担忧,认为工作变得更简单意味着对人力的需求减少。此外,还有人认为,尽管AI在提升效率方面发挥了作用,仍然难以替代程序员的复杂思维与创造力。

总体来看,ChatGPT在bug修复能力上的强劲表现并不会对程序员造成致命冲击。但如果我们再将目光放到OpenAI的其他举措上,这一切就可能另有一番解读。

### OpenAI的市场布局

在此之前,OpenAI已明确表示,ChatGPT的重要用途之一是帮助程序员检查和修复代码。换句话说,它被当作一种辅助工具,而不是取代程序员的角色。为了进一步助力ChatGPT的发展,OpenAI在拉美和东欧等地区招募了1000个外包岗位,负责数据标注和训练ChatGPT的编程能力。这其中,大约40%的外包员工都是程序员,他们为OpenAI构建数据集,以便其学习软件工程任务。

例如,南美的一位软件开发人员分享了他为OpenAI进行的五小时无偿编码测试的经验,过程中不仅需要用书面英语解释编码问题,还得提供解决方案。他的参与显示了OpenAI希望通过详细的训练数据,为ChatGPT提供更为准确的模型训练。

### 未来展望

尽管ChatGPT在修复bug方面的能力引发了一些担忧,但如果它的发展能够减轻程序员的重复性工作负担,让他们能专注更具创造性的任务,或许这也是一件好事。OpenAI成立之初的宗旨便是确保通用人工智能能够惠及全人类,虽然这种转型可能让部分人感到不安。

无论如何,ChatGPT的发展无疑引起了广泛的关注与讨论。从历史上看,随着每一次技术进步,AI都伴随着“取代人类”的争论。但显然,商业领域对OpenAI的支持似乎从未减弱。微软近期宣布将向OpenAI追加数十亿美元投资,并将其模型融入微软的产品之中。同时,风投基金Founders Fund也在考虑对OpenAI进行投资。

### 结论

在第一轮实验中,ChatGPT未能解决QuixBugs数据集中的bitcount问题,但当重新进行提问时,ChatGPT已经能够正确回答。这是否表明ChatGPT从这次研究中吸取了教训,改进了自己的能力?无疑,这将成为人们观察和讨论的焦点。在未来,我们也许能看到AI与程序员之间更加富有成效的协作。

滚动至顶部