ChatGPT拿下AI修bug顶级成绩！31个Bug修复率领先

ChatGPT的修复bug能力究竟有多强呢？这一次，来自德国和英国的研究人员终于对这个问题进行了严谨的研究，特意搭建了一个“擂台”来检验ChatGPT在修复代码错误方面的表现。

### ChatGPT的修复成绩

在这项研究中，除了ChatGPT，研究人员还引入了另外三款修复bug的AI工具，分别是CodeX、CoCoNut和Standard APR，一起测试它们对40段出错代码的修复能力。结果令人瞩目：ChatGPT成功修复了31个bug，远超第二名的21个，成功取得了“AI修复bug界”的最佳成绩！

### 研究背景与方法

虽然ChatGPT并不是专门为修复bug而设计的，但自问世以来，许多用户发现其在这方面的潜力。为此，研究团队引入了标准的错误修复基准集QuixBugs进行评估，并以此为基础进行测试。研究者们选择了40个问题，让这些AI工具逐一尝试修复。研究方法非常简单，研究人员只需向ChatGPT提问：“这个代码有什么错误吗？”

第一轮的结果显示，ChatGPT修复了19个错误，而其他AI工具的表现如下：CodeX修复21个，CoCoNut修复19个，Standard APR则仅修复了7个。研究人员注意到，ChatGPT与CodeX的回答相似度较高，原因在于它们源于同一个语言模型家族。

### ChatGPT的学习能力

虽然ChatGPT在第一轮的表现并不如CodeX出色，但它的回答会随着提问的深入而变得更加准确。例如，在处理一个名为bitcount的问题时，ChatGPT起初给出了错误答案，但在提供更多信息后，它成功修复了这个bug，并在最终的评估中总共答对了31个问题。

### 网友的反应

对研究结果，各界网友的反应不一。有网友认为，这并不意味着程序员需要感到危机，反而是一种值得高兴的情况，因为他们可以借助这个强大的工具更高效地完成工作；相对而言，程序员的工作将更加轻松。

然而，也有人对此表示担忧，认为工作变得更简单意味着对人力的需求减少。此外，还有人认为，尽管AI在提升效率方面发挥了作用，仍然难以替代程序员的复杂思维与创造力。

总体来看，ChatGPT在bug修复能力上的强劲表现并不会对程序员造成致命冲击。但如果我们再将目光放到OpenAI的其他举措上，这一切就可能另有一番解读。

### OpenAI的市场布局

在此之前，OpenAI已明确表示，ChatGPT的重要用途之一是帮助程序员检查和修复代码。换句话说，它被当作一种辅助工具，而不是取代程序员的角色。为了进一步助力ChatGPT的发展，OpenAI在拉美和东欧等地区招募了1000个外包岗位，负责数据标注和训练ChatGPT的编程能力。这其中，大约40%的外包员工都是程序员，他们为OpenAI构建数据集，以便其学习软件工程任务。

例如，南美的一位软件开发人员分享了他为OpenAI进行的五小时无偿编码测试的经验，过程中不仅需要用书面英语解释编码问题，还得提供解决方案。他的参与显示了OpenAI希望通过详细的训练数据，为ChatGPT提供更为准确的模型训练。

### 未来展望

尽管ChatGPT在修复bug方面的能力引发了一些担忧，但如果它的发展能够减轻程序员的重复性工作负担，让他们能专注更具创造性的任务，或许这也是一件好事。OpenAI成立之初的宗旨便是确保通用人工智能能够惠及全人类，虽然这种转型可能让部分人感到不安。

无论如何，ChatGPT的发展无疑引起了广泛的关注与讨论。从历史上看，随着每一次技术进步，AI都伴随着“取代人类”的争论。但显然，商业领域对OpenAI的支持似乎从未减弱。微软近期宣布将向OpenAI追加数十亿美元投资，并将其模型融入微软的产品之中。同时，风投基金Founders Fund也在考虑对OpenAI进行投资。

### 结论

在第一轮实验中，ChatGPT未能解决QuixBugs数据集中的bitcount问题，但当重新进行提问时，ChatGPT已经能够正确回答。这是否表明ChatGPT从这次研究中吸取了教训，改进了自己的能力？无疑，这将成为人们观察和讨论的焦点。在未来，我们也许能看到AI与程序员之间更加富有成效的协作。

ChatGPT拿下AI修bug顶级成绩！31个Bug修复率领先

相关文章