4岁男孩3年求医17位专家无果，ChatGPT精准揪出病因

“怪病”缠身3年、求医无果，最终竟被ChatGPT成功诊断！这是一名4岁男孩的真实经历。在一次运动后，男孩的身体开始剧痛。母亲先后带他看了17名医生，涵盖了儿科、骨科等多个领域，并进行了MRI等一系列检查，但没有一位医生真正找出病因。最终，母亲没有抱太大希望地尝试寻求ChatGPT的帮助，后者却根据描述和检查报告给予了正确的建议。

这一话题迅速冲上知乎热榜，并在Reddit上获得了2.3K的热度。

有网友表示，这次ChatGPT的表现令人振奋：“每个医生的办公室都可以配备一个AI助手，帮助比较医生的诊断结果。”还有网友提到谷歌专门训练的辅助医疗诊断模型Med-PaLM，想知道它的诊断结果如何，认为这是对大模型的一个完美测试机会。

那么，这究竟是怎么一回事？到底是什么样的“怪病”？故事的主人公名叫Alex，他的母亲Courtney有两个孩子。2020年的一天，Alex的保姆告诉Courtney，Alex每日都需要服用止痛药，不然疼痛就会无法忍受。随后，Alex又出现了磨牙的现象，父母将这两件事情联系在一起，认为可能是由于换牙或蛀牙引发的疼痛。于是，母亲带着Alex去看牙医，Alex为期三年的寻医之旅由此开始。牙医检查后并未发现任何问题，但鉴于Alex磨牙的情况，推荐他们寻找治疗气道阻塞的正畸医生。

正畸医生发现Alex的上颚较小，导致呼吸困难，并为他放置了一个扩张器。这种治疗确实起到了效果，母亲一度以为Alex的病情即将好转。然而，现实却并不如预期，母亲很快发现Alex的身高停止了增长。

这时，她求助了一名儿科医生。医生认为Alex可能受到了新冠病毒的影响，但母亲对此解释并不满意。尽管如此，2021年初，母亲还是带着Alex进行了复查。医生告诉她，Alex的身高“长高了一点”，但发现他的左右脚不平衡，并建议进行物理治疗。然而，在物理治疗开始之前，Alex又出现了加重的头痛症状。

眼看物理治疗无法及时进行，母亲转而咨询神经内科医生，得到的结论是Alex患有偏头痛。在与头痛抗争的同时，Alex还受到极度疲惫的困扰，于是母亲又带他去耳鼻喉科检查，看看是否有鼻窦问题影响睡眠。经过一系列波折后，Alex终于开始接受物理治疗。治疗师认为他可能患有一种名为Chiari畸形的先天性疾病，这种病会导致大脑在脊柱与头骨相接处出现异常。

母亲开始深入研究这个问题，并带着Alex看了新的儿科医生、小儿内科医生、成人内科医生和肌肉骨骼医生等，最终Alex见过的医生多达17位，几乎遍及了所有能想到的科室，甚至被送入急诊，仍然没有得到正确的答案。

直到母亲尝试了ChatGPT，整个事情才出现了180度的转机。抱着试一试的心态，母亲注册了一个ChatGPT账户，并将Alex的症状以及MRI报告的注释输入给它，其中有个细节是Alex无法完成盘腿坐的动作。ChatGPT根据这些信息给出了诊断——脊髓栓系综合征（TCS）。当然，Courtney并没有马上相信，而是先加入了Facebook上的一个家长交流群，结果发现群里的讨论与Alex的症状极为相似。这个发现让她重新燃起了希望，事后母亲回忆道，她在电脑前坐了一整晚，思考这一切。

带着这一结论和MRI报告，Courtney找到了神经外科医生。这位医生一眼就看出了MRI的异常，与ChatGPT的诊断一致，并指出了栓系的具体位置。随后的治疗进展顺利，Alex接受了手术，目前正在康复中。

那么，为什么Alex直到第18个医生才最终确诊呢？首先，与Alex本身的情况有一定关系。脊髓栓系综合征的患者通常背部会有裂口，但Alex并没有这种情况，这种情况被称为隐式脊髓栓系综合征（OTCS）。虽然TCS是罕见病，但新生儿的发病率却相对较高，约为0.005%到0.025%。而OTCS则相对罕见，以至于没有相关的统计数据。

不过，最终外科医生在查看MRI图像后迅速做出了判断。先前没有确诊的原因，或许在于“找错了医生”：在那17名医生中，确实没有外科领域的专家。虽然这些专业医生都在各自领域内擅长，但他们未必了解其他学科的知识。这暴露了一个问题，当面临复杂病情时，这些医生没有考虑进行多学科会诊，也可能没有全面询问Alex的病史。正如母亲Courtney所言，没有人愿意处理“超出自身学科范围”的问题，也没有医生能给出明确的诊断线索。而ChatGPT的知识库在广度上显然比某些专科医生更为丰富，最终帮助找到了正确的结论。

那么，ChatGPT的成功诊断究竟是偶然，还是它确实具备了一定的诊断能力呢？

实际上，利用ChatGPT或GPT-4进行疾病诊断并不是首次。自GPT-4问世以来，就曾有人用它成功诊断自家宠物犬的病例，这段经历曾在网上广为传播。一名狗主人向GPT-4描述了狗狗发病的症状及治疗过程，最终GPT-4准确地判断出了病因。

当然，学术研究指出，ChatGPT或GPT-4并非完全可靠的AI医生。例如，哈佛大学附属医院布莱根妇女医院（BWH）的一项研究显示，ChatGPT在提供癌症治疗建议时，只有62%的案例是完全正确的。

在其他案例中，有34%的建议至少包含一个或多个与正确诊断不一致的答案，2%的案例给出了不可信的诊断结果。因此，目前还不能完全依赖ChatGPT或GPT-4进行诊断，毕竟它们在这一过程中仍无法与经验丰富的专业医生相比。

美国医学会（AMA）的主席Jesse M. Ehrenfeld指出，尽管AI能够给出诊断结果，最终的责任仍然在医生身上。综上所述，大家可以使用AI辅助诊断，但仍需前往医院找专业医生确诊。

如果考虑用大型模型进行疾病询问，哪个模型值得一试呢？一些用户分享了他们的经历，经过测试发现，GPT-4的表现更为突出。有网友表示，自己曾因慢性咳嗽咨询多位医生，最终还是在YouTube频道上得知自己患有隐性咽喉返流（LPR）。在使用大语言模型进行测试时，只有GPT-4成功做出了诊断，而Claude 2也相近但未能自主得出结论。

你是否尝试过使用AI帮助判断病情？效果如何呢？

4岁男孩3年求医17位专家无果，ChatGPT精准揪出病因

相关文章