4岁男孩3年求医17位专家无果,ChatGPT精准揪出病因

推荐使用ChatGPT4.0中文网,国内可直接访问:www.chatgp4.com

“怪病”缠身3年、求医无果,最终竟被ChatGPT成功诊断!这是一名4岁男孩的真实经历。在一次运动后,男孩的身体开始剧痛。母亲先后带他看了17名医生,涵盖了儿科、骨科等多个领域,并进行了MRI等一系列检查,但没有一位医生真正找出病因。最终,母亲没有抱太大希望地尝试寻求ChatGPT的帮助,后者却根据描述和检查报告给予了正确的建议。

这一话题迅速冲上知乎热榜,并在Reddit上获得了2.3K的热度。

有网友表示,这次ChatGPT的表现令人振奋:“每个医生的办公室都可以配备一个AI助手,帮助比较医生的诊断结果。”还有网友提到谷歌专门训练的辅助医疗诊断模型Med-PaLM,想知道它的诊断结果如何,认为这是对大模型的一个完美测试机会。

那么,这究竟是怎么一回事?到底是什么样的“怪病”?故事的主人公名叫Alex,他的母亲Courtney有两个孩子。2020年的一天,Alex的保姆告诉Courtney,Alex每日都需要服用止痛药,不然疼痛就会无法忍受。随后,Alex又出现了磨牙的现象,父母将这两件事情联系在一起,认为可能是由于换牙或蛀牙引发的疼痛。于是,母亲带着Alex去看牙医,Alex为期三年的寻医之旅由此开始。牙医检查后并未发现任何问题,但鉴于Alex磨牙的情况,推荐他们寻找治疗气道阻塞的正畸医生。

正畸医生发现Alex的上颚较小,导致呼吸困难,并为他放置了一个扩张器。这种治疗确实起到了效果,母亲一度以为Alex的病情即将好转。然而,现实却并不如预期,母亲很快发现Alex的身高停止了增长。

这时,她求助了一名儿科医生。医生认为Alex可能受到了新冠病毒的影响,但母亲对此解释并不满意。尽管如此,2021年初,母亲还是带着Alex进行了复查。医生告诉她,Alex的身高“长高了一点”,但发现他的左右脚不平衡,并建议进行物理治疗。然而,在物理治疗开始之前,Alex又出现了加重的头痛症状。

眼看物理治疗无法及时进行,母亲转而咨询神经内科医生,得到的结论是Alex患有偏头痛。在与头痛抗争的同时,Alex还受到极度疲惫的困扰,于是母亲又带他去耳鼻喉科检查,看看是否有鼻窦问题影响睡眠。经过一系列波折后,Alex终于开始接受物理治疗。治疗师认为他可能患有一种名为Chiari畸形的先天性疾病,这种病会导致大脑在脊柱与头骨相接处出现异常。

母亲开始深入研究这个问题,并带着Alex看了新的儿科医生、小儿内科医生、成人内科医生和肌肉骨骼医生等,最终Alex见过的医生多达17位,几乎遍及了所有能想到的科室,甚至被送入急诊,仍然没有得到正确的答案。

直到母亲尝试了ChatGPT,整个事情才出现了180度的转机。抱着试一试的心态,母亲注册了一个ChatGPT账户,并将Alex的症状以及MRI报告的注释输入给它,其中有个细节是Alex无法完成盘腿坐的动作。ChatGPT根据这些信息给出了诊断——脊髓栓系综合征(TCS)。当然,Courtney并没有马上相信,而是先加入了Facebook上的一个家长交流群,结果发现群里的讨论与Alex的症状极为相似。这个发现让她重新燃起了希望,事后母亲回忆道,她在电脑前坐了一整晚,思考这一切。

带着这一结论和MRI报告,Courtney找到了神经外科医生。这位医生一眼就看出了MRI的异常,与ChatGPT的诊断一致,并指出了栓系的具体位置。随后的治疗进展顺利,Alex接受了手术,目前正在康复中。

那么,为什么Alex直到第18个医生才最终确诊呢?首先,与Alex本身的情况有一定关系。脊髓栓系综合征的患者通常背部会有裂口,但Alex并没有这种情况,这种情况被称为隐式脊髓栓系综合征(OTCS)。虽然TCS是罕见病,但新生儿的发病率却相对较高,约为0.005%到0.025%。而OTCS则相对罕见,以至于没有相关的统计数据。

不过,最终外科医生在查看MRI图像后迅速做出了判断。先前没有确诊的原因,或许在于“找错了医生”:在那17名医生中,确实没有外科领域的专家。虽然这些专业医生都在各自领域内擅长,但他们未必了解其他学科的知识。这暴露了一个问题,当面临复杂病情时,这些医生没有考虑进行多学科会诊,也可能没有全面询问Alex的病史。正如母亲Courtney所言,没有人愿意处理“超出自身学科范围”的问题,也没有医生能给出明确的诊断线索。而ChatGPT的知识库在广度上显然比某些专科医生更为丰富,最终帮助找到了正确的结论。

那么,ChatGPT的成功诊断究竟是偶然,还是它确实具备了一定的诊断能力呢?

实际上,利用ChatGPT或GPT-4进行疾病诊断并不是首次。自GPT-4问世以来,就曾有人用它成功诊断自家宠物犬的病例,这段经历曾在网上广为传播。一名狗主人向GPT-4描述了狗狗发病的症状及治疗过程,最终GPT-4准确地判断出了病因。

当然,学术研究指出,ChatGPT或GPT-4并非完全可靠的AI医生。例如,哈佛大学附属医院布莱根妇女医院(BWH)的一项研究显示,ChatGPT在提供癌症治疗建议时,只有62%的案例是完全正确的。

在其他案例中,有34%的建议至少包含一个或多个与正确诊断不一致的答案,2%的案例给出了不可信的诊断结果。因此,目前还不能完全依赖ChatGPT或GPT-4进行诊断,毕竟它们在这一过程中仍无法与经验丰富的专业医生相比。

美国医学会(AMA)的主席Jesse M. Ehrenfeld指出,尽管AI能够给出诊断结果,最终的责任仍然在医生身上。综上所述,大家可以使用AI辅助诊断,但仍需前往医院找专业医生确诊。

如果考虑用大型模型进行疾病询问,哪个模型值得一试呢?一些用户分享了他们的经历,经过测试发现,GPT-4的表现更为突出。有网友表示,自己曾因慢性咳嗽咨询多位医生,最终还是在YouTube频道上得知自己患有隐性咽喉返流(LPR)。在使用大语言模型进行测试时,只有GPT-4成功做出了诊断,而Claude 2也相近但未能自主得出结论。

你是否尝试过使用AI帮助判断病情?效果如何呢?

滚动至顶部