ChatGPT带火了大模型之后,全世界大厂都卷了起来。
强大的语言理解能力、生成能力、逻辑推理能力,让大模型在医疗领域大有可为。
是的,硅谷巨头们早已意识到,GPT在医疗领域的无限潜力。
早在今年2月,ChatGPT在美国医学执照考试中,以60%准确度的回答,已经接近真人医生。
话虽如此,但只要深入调查这个行业就会发现,目前市面上真正能够投入使用的医疗大模型,还寥寥无几。
原因就在于,医疗AI的门槛相当之高,在这个交叉领域要想成功做出产品,既要懂医疗,又要懂技术。
国内的医疗大模型之路该如何走?让我们先看看国外大厂的发展路线。
硅谷巨头,纷纷入局医疗GPT
当前,大型语言模型的发展,已经有足够的潜力给医疗保健整个行业带去更加深远、广泛的变革。
比如,远程问诊效率、准确度提升,简化医疗文档,甚至还可以帮助医疗人员减少工作量提高效率。
GPT-4、PALM2作为当前最先进的语言模型,微软、谷歌等硅谷巨头必然将它的能力拓展到医疗领域。
上个月,微软和EpicSystems宣布,将GPT-4引入医疗保健领域,用于医护人员对患者的消息回复,分析医疗记录,以及寻找新的趋势。
另外,今年夏天,微软和Nuance将把GPT-4引入医疗保健文档技术。微软称,整合后GPT-4提?了AI模型的整体准确性,但没有透露准确率。
此外,谷歌过去几年里也一直在探索如何用AI来改善医疗保健,比如帮助早期发现疾病,扩大医疗服务范围等等。
刚刚过去的谷歌I/O大会上,谷歌在医疗领域的微调模型Med-PaLM也升级到了第二代。
值得一提的是,Med-PaLM2一出手,就成为首个在USMLE(美国医师执照考试)上达到「专家」水平的模型,得分为85.4%。
甚至,它比迭代之前的Med-PaLM性能提高了18%,远超同类AI模型。
那么,现在通用的大语言模型,在回答医学问题方面表现怎样呢?我们来实测一下。
MedPaLM的表现很专业,然而,如果从应用场景看,MedPaLM还没有那么高的实用性,因为它主要还是以做题为主。
要说回答问题,那当然少不了当红大模型ChatGPT。
可以看到,它的回答就比较中规中矩,没有太多惊喜。
而一旦给它上点难度,问一道国家执业医师资格考试真题,它就寄了……
可见,类似ChatGPT这样的通用类LLM,高度依赖文本统计概率生成答案,因此回答的准确性无法保证。
但是,在医疗应用场景中,准确性和一致性是底线,绝不能出错。
垂直医疗大模型,难在哪?
从谷歌和微软做医疗大模型的发展路线,可以看到,要想让LLM在医疗领域充分发挥能力,有一些关键的难点。
1.数据孤岛
首先,最致命的难点就是,垂直领域的大模型,如何突破数据「卡点」?
而垂直医疗领域AI大模型,只
转载请注明:http://www.0431gb208.com/sjsbszl/7291.html