毕业论文
您现在的位置: 语言识别 >> 语言识别介绍 >> 正文 >> 正文

e医疗原创语音识别技术开启医疗信息

来源:语言识别 时间:2022/7/9
治疗白癜风去哪里 http://m.39.net/pf/a_8923448.html

点击上方蓝字   医疗行业因信息化建设的不断深入和政策的大力推进而逐步从信息化向智能化建设发展,作为一种让信息生产更为有效、高效的技术,语音识别可谓是智能化的基础。

  而事实上,语音识别技术在国外很早就已经应用到了医疗行业当中,在需要大量书写的场景中发挥着重要作用——无论是在出入院记录、护理报告、手术记录这些录入场景,还是放射科、病理科等医技科室的工作场景,语音识别技术的发展推动着医疗行业信息化不断向智能化发展。

  在国内,一批拥有语音识别技术自主知识产权的企业敏锐地捕捉到了医疗行业的广阔前景,专门针对医疗行业提供了定制化模型和专业语料库,使其在医疗环境中的应用效果更佳。语音识别技术正在深入融合医疗信息化各节点,随着这些企业对医疗行业进一步深耕,更多结合医疗流程的应用场景将会落地。

语音识别技术在医疗行业的起点

*建议手机横屏浏览此图

  语音识别技术在年被飞利浦电子公司首次应用于医疗卫生领域,主要用在语音拨号预约、语音命令控制、报告录入等方面。

  飞利浦电子公司推出的面向医疗领域的语音识别系统终端SpeechMagic,目前已经有超过家医疗解决方案供应商无缝整合SpeechMagic系统,实现了医疗领域内的语音到文本的转换。西门子医疗系医院提供的个性化解决方案中,成功借助语音识别系统,优化了该院的医疗文本录入流程,该院医护人员提交报告的时间由原来的10.5小时减少到6.5小时,节省了38%的工作量。

  年IBM公司将Watson系统部署到医生的办公室。Watson能“听懂”医生的自然语言问题,同时能快速分析堆积如山的医疗研究数据并给出答案。

  这里需要提到Nuance公司,该公司是最大的专业从事语音识别软件、图像处理软件及输入法软件研发、销售的公司,占有全球近80%的语音技术市场,相关专利技术超过个。Nuance为美国的医疗行业提供医疗语音转录服务,利用拥有专利权的互联网语音和数据分布技术、客户基础技术和医学语言专家,可以将医生的语音录音转换成电子医疗记录档案。遗憾的是,目前该公司在医疗领域没有中文语音识别的产品。

  从统计资料看,美国临床中使用语音识别录入的比例已能够达到40%~60%,主要用于放射科、病理科、急诊室等部门,并能够明显提高工作效率。美国医生传统上是使用录音设备记录医生口授医嘱和病情记录,由秘书根据录音手工录入计算机,再由医生修改、签字。

国内近年来对语音识别技术的研究

  随着计算机性能的进步和语音识别技术的提升,近年来,国内对语音识别技术在医疗行业的应用也开始有了研究和应用。

  中南大学对孤立词语音识别算法在医疗仪器中的应用进行了研究,通过系统对孤立词的识别,使得医疗仪器(比如便携式肺功能仪、家用心脑血管仪等)使用起来更加方便自然,让老年人和残疾人可以无障碍地使用。不过该研究仅对具有独立意义的单个词汇进行识别,降低了语音识别的难度,适用于简单的应用场景。

  华中科技大学对电子病历中的语音处理进行了研究,该研究主要对语音的压缩以及和电子病历一起存储进行了研究,在语音识别方面只要求识别出哪些是语音需要压缩处理,哪些不是语音不需要进行处理保存,由于其主要目的就是保留语音录音作为发生医疗纠纷时的法律依据,因此并没有对语音内容进行识别。

  医院对语音辨识在医疗设备中的应用进行了探讨,实现了使用语音识别来控制高压注射泵的实验,主要目的是研究通过语音识别来控制医疗设备的运作。该研究对语音识别的准确率要求很高,否则医疗设备的错误动作有可能会危及患者的生命。但其语音识别处理只需做到对医疗设备动作对应的部分固定指令进行反馈即可。

  上海医疗器械高等专科学校对基于语音识别技术的影像科诊断报告生成系统进行了研究和设计。其采用语音识别引擎和诊断报告系统结合的方式来设计整个系统,语音识别引擎方面采用MicrosoftSpeechSDK来开发。但仅仅是个设计,我们目前并没有看到设计的最终实现和应用。

  直到年,医院与北京云知声信息技术有限公司(以下简称“云知声”)合作,医院各个科室的业务进行了梳理,整理了超过40GB的医疗文本资料,并对这些资料进行了分类、检索等处理,使得定制语音模型覆盖了各个科室常用的病症、药品名称、操作步骤等关键信息,使语音识别准确率超过95%的水平,语音医院各个科室得到广泛落地和应用。

专家言温州医院计算机技术与信息管理处处长,温州医科大学联想智慧医疗研究院副院长兼技术总监潘传迪语音识别技术在行业当中早已提出过,并且有过应用,但是因为当时语音识别技术发展的水平有限,导致这项技术没有在医疗行业应用起来。近期,随着语音识别技术以及相关技术的发展,医院信息化建设的需要,这一技术又在医疗行业呈现了新的应用趋势。但是,面临医疗这个特性极强的行业,语音识别技术的广泛应用因行业特性面临着三大挑战:识别速度、识别准确率、医疗专业性带来的特殊符号的智能识别。医院信息化建设至今,已经在人性化和便捷化方面有了很大的进步,医护人员可以通过点选的方式进行文字的输入和组合。如果语音识别速度不高,其实际效果反而不如手动操作。医院信息中心主任路健目前,医院的应用是一种新的录入方式,一种新的输入法。医院在试用语音识别系统时出现了与电子病历厂商的沟通协作问题。医院为了杜绝同质化病历的出现,电子病历系统通常是禁止复制粘贴的。云知声的语音识别系统在我院试用时,后台采用的是复制粘贴的原理,打个比方也就是:语音识别录入的过程是在语料库中复制相应的内容,而后粘贴在病历上。这种机制导致语音识别后无法录入电子病历系统,经过多方努力,最终保证了电子病历系统即使不能复制粘贴,语音识别后也可以正常录入,所以我们需要将各个系统与语音识别系统相互磨合,最大限度地解放医生双手,才能实现高效、准确的录入。医院信息中心主任顾慧医院与云知声的合作,源于院长希望语音录医院的一些场景,提高效率。通过了解和试用,我们最后选择了与云知声合作。从效果来看,通过语音录入病历确实存在优点。第一,用于手术记录,手术记录是手术者书写的反映手术经过、术中发现及处理等情况的特殊记录,是病历资料中的重要部分,不仅可以反映术者的理论水平和技能水平,是医教研的第一手资料。根据规范要求手术记录应由术者书写,但有时由第一助手书写,手术者只签名而不认真审查内容。就会存在手术经过、术中发现及处理记录不详细。语音录入可让手术者在手术休息间隙对上一个患者整个手术过程进行语音录入并暂时储存。后期由助手根据此文档加以编辑就形成了符合书写规范和标准的文档。有效避免“手术者不记录,记录者不手术”现象,大大提高手术记录质量。第二,在医技科室,如内窥镜、B超、CT室可以通过语音识别系统在读片时完成报告相关内容书写。第三,在临床书写的过程中,语音识别系统有效提高了效率。第四,药物试验机构召开伦理委员会发言者的语音转写记录等。在下一步的发展中,要加强对医疗计量的特殊单位和符号的自动识别,进一步提高效率和准确率。

定制化助语音识别技术落地应用

刘升平博士北京云知声信息技术有限公司资深AI技术专家刘升平博士:医疗环境的特殊性是要极为重视的,通用语音识别系统是无法达到医疗机构中的应用要求的。

  面对语音识别技术,医院最强调的就是:准确率、速度、解决口音问题,以及有效降噪。是否能够在医疗行业有更深入的应用、推广,取决于语音识别技术必须在这几方面有令人满意的表现。

  针对于语音识别技术将如何更好地服务医疗行业这一话题,云知声资深AI技术专家刘升平博士介绍道,医疗行业因其特殊性,需要做非常多的定制优化工作。

  “云知声为医疗行业从语言模型,和声学模型,硬件降噪,识别结果后处理四个方面做了定制优化。   第一,在语言模型方面,我们从各个数据源抓取了约40G的病历相关语料以及30多万条医疗专业术语,专门训练出了一个医疗领域的语言模型;   第二,在声学模型方面,医院特定使用环境下的各种噪音,并把这些噪音加入到语音训练数据中。此外,我们还利用了一个五千多小时的全国各地重口音普通话的数据集来训练我们的声学模型,这样就可以识别带各种口音的普通话了。   第三,我们采用专业的带降噪功能的麦克风,这个麦克风也是在国外用得最广的,它采用医学级别的抑菌材料,可以有效消除环境噪音,抑制背景噪音,支持多人同时讲话而互不干扰。   第四,为了确保高准确率,云知声已经开始做后向纠错。目前云知声的语音识别系统已经达到95%以上的识别率,医生在写病历的时候会在语音录入时出现“呃”、“啊”、“那个”、“然后”等口语化的语言,云知声通过一些自然语言处理技术实现后处理能力,通过后向纠错并结合医学专业知识做后向语义理解,将这些口语化的内容自动转换成书面语言,可以使准确率达到99%的水平。”

  刘升平博士强调:“医疗环境的特殊性是要极为重视的,通用语音识别系统是无法达到医疗机构中的应用要求的。”与此同时,刘升平博士也认可:应用的不断推广和技术的发展是相辅相成的。以云知声为例,通过云平台不断积累的用户数据,语音识别引擎的准确率也不断得到提高。

  从语音识别技术发展来看,之前的技术是基于PC端的,而现在是基于云端的。据刘升平博士介绍,响应速度是一个非常重要的考量角度。通过强大的云端计算和算法优化能力,语音识别结果响应时间可以控制在毫秒左右,很好地解决了速度问题。

  在训练语音模型时,云知声以国内各个地方的口音作为基础,汇集了几千人的各种口音数据。“通过这些数据再训练出一个很大的模型来,那么在口音的适配性上就基本解决了。”

  医院的信息系统越来越自动化,可以通过模板的方式提高文书的质量和录入效率,但是面对每一个患者的数据时,系统需要尽可能多地体现出个性化的内容,语音识别技术在这时就会发挥巨大的作用。

  语音识别是一门交叉学科,涉及信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能……它并非新生事物,但走进应用场景,也不过是近二十年的事,虽说有所成就,但并不能算拿到“满分”——医疗行业,更是如此。

医疗行业正在进行一场变革——用信息化手段提升生产力。有市场,有需求,这正是语音识别技术进入医疗行业的大好机会。而面对这个特殊的行业和语音识别技术的高门槛,那些有“钉子精神”、愿意钻研行业需求的企业,更有机会与行业一起成长。

?以上文章来源

e医疗年8月刊原创文章,转载请注明来源。

预览时标签不可点收录于合集#个上一篇下一篇 转载请注明:http://www.0431gb208.com/sjszlfa/725.html