毕业论文
您现在的位置: 语言识别 >> 语言识别介绍 >> 正文 >> 正文

知识图谱在流行病学调查中的实践专家讲坛

来源:语言识别 时间:2023/5/9

众所周知,这次波及全世界的新冠病毒的两种主要传播方式分别为“飞沫传播”和“接触传播”,从各省市公布的大量确诊病例活动轨迹证实,家庭传播、人员聚集、社区接触、公共场所等是主要的传播渠道。开展流行病学调查,在第一时间找出人与人、人与地点、人与交通工具之间存在相关关系,从中提取有价值的关系链,对于阻断传播链和及时发现密切接触人起着至关重要的作用。海致充分应用知识图谱技术,积极探索在疫情防控流行病学调查中的全时空、交互式、可视化应用,取得了明显成效。

流行病学调查是什么

流行病学调查,简称“流调”,是通过对收集汇总每例病例的基本信息、家庭情况、发病就诊情况、发病前的旅行史、居住史及活动情况等资料,分析这些纷繁复杂的信息,判定病例的感染来源以及其他密切接触者,最终明确疾病的传播方式和途径。流调是疫情防控的基础性工作,在未知新型传染病初期快速扩散且无针对性的治疗手段、疫苗等措施时,隔离治疗和医学观察是阻断传播的最有效方式,而通过流调能够及时发现疾病的传播模式、传播链条、传播地点以及密切接触者,对医学研究以及抑制疾病进一步扩散传播都具有非常重要的意义。

流行病学调查的难点?以往流调的方式主要是通过现场问询相关人、查阅相关资料的方式进行,问询的对象包括患者本人、患者家属、知情人、诊治医生等,但由于涉及对象众多,需要逐个问询并记录,需要通过各类信息汇总起来分析,过程有点像公安部门的“破案工作”,从哪怕是一些不起眼的蛛丝马迹中找到关键线索,确定传播链条,所以工作量巨大,时间周期会较长,而且可能因为问询对象的主观描述的无意疏漏等各种原因,导致线索无法串联起来。

知识图谱在流调中发挥哪些作用

在当前信息爆炸、数据指数级增长的背景下,催生了众多海量数据的计算和分析技术,其中,基于图数据库技术的图谱关联分析是寻找相关关系的利器之一,通过对海量的数据中归纳提炼“实体”、“关系”以及“事件”三要素,汇聚形成知识网络存储在图数据库中,通过搜索、关系扩展等方式获取信息,这项产品技术我们称之为“知识图谱”。

通过知识图谱产品技术的辅助,可以几小时甚至是数十分钟内就可以完成大量确诊病例的相关关系分析,大幅缩短传播链的分析调查的工作量和时间周期。

知识图谱流调案例演示

从发现高危到阻断传播,关键在“找人”,要快速找到关键节点和关键传播链。我们通过一个案例具体阐述如何通过知识图谱完成流行病学调查。该案例分析基于某地市公安业务数据和卫健委数据有效整合的环境下,对19例确诊病例(数据均进行脱敏处理)进行分析。

1、确诊病例对象关系推演

首先通过图谱批量查询出确诊病例患者并上图,已确诊人员带有“感染新冠状病确诊”标签,可以通过“标签视图”查看。

通过对确诊病例人员间进行群体关系推演,可以快速将确诊人员相互之间的相关关系全部推演出来,并通过可视化关系网络的方式直观呈现,该图中推演出的关系主要包括同航班、同公交交通关系、同单位同事关系、同小区及同楼栋的同居住地关系、同户籍地村组的家族关系和同户的家庭关系。

2、病例传播模式分析

通过确诊病例之间的相互关系,我们可以总结疾病的传播模式。从图中的分析我们可以发现:

赵某国家庭、陈某东家庭、李某强家庭、彭某海家庭、张某等5个家庭有多名甚至是全员确诊,疾病具有家庭聚集传播特点;

赵某国与彭某海属于同楼栋邻居,后经核实确实有过多次近距离短暂接触交谈;

陈某东家庭与张某家庭、李某民家庭属于同小区,经陈某东自述张某、李某来过家里打麻将;

赵某民、邓某及罗某良是同单位同事,3人分别确诊,说明在单位工作场所的密切接触也会传播;

李某民、李某强、李某秀、李某国属于同一家族,后经核实李某民与其妻子钟某在除夕夜回老家与父亲李某强等人一起吃年夜饭,最终导致聚集性感染;

3、传播时序及链条分析

通过分析所有确诊病例的发病时间,赵某国及陈某东发病确诊时间最早且有武汉旅居史,分析两人的活动轨迹、接触人群等,可以分析出传播时序及链条。

赵某国的活动轨迹时序及密切接触者:

1月19日,赵某国与陈某东乘坐同一航班MU***8从武汉回到本地,其后赵某国在1月24号确诊,陈某东在1月25日确诊;赵某国回本地后在居住小区活动了5天,其间多次与同楼栋邻居彭某海近距离交谈,彭某海在1月25日确诊;1月20日赵某国的父亲赵某民还在单位上班直至1月24日,其间与同事邓某及罗某良有密切接触,随后3人先后被确诊;邓某在1月23日乘坐了20**路公交车,乘坐同班次公交的还有刘某,随后2人先后被确诊;

陈某东的活动轨迹时序及密切接触者:

1月19日,赵某国与陈某东乘坐同一航班MU****8从武汉回到本地,其后赵某国在1月24号确诊,陈某东在1月25日确诊;1月20日,陈某东与同小区张某及李某民在家打麻将,随后张某、李某民先后确诊;张某在与陈某东打完麻将后回家未出,随后张某及其家人王某、王某丽先后确诊;1月24日,李某民在确诊前与家人回老家吃除夕年夜饭,其间密切接触家人李某强、李某国、李某秀,随后先后确诊;

单人或多人的生活轨迹可以通过轨迹时序图展示和分析:

4、潜在感染人群分析

经过上述关联关系和生活轨迹的分析,我们证实了1月19日的航班传播、彭某国、陈某东所在小区的社区传播,赵某民工作单位的聚集传播以及邓某兵1月23日20**交通工具传播,我们需通过进一步扩展分析找到其他密切接触者,并逐一核实是否有异常症状:

通过扩展所有确诊病例找到其有密切接触的家庭成员;通过赵某国、陈某东的同次航班扩展找到其他乘客;通过赵某民扩展找到1月20日-24日在单位上班的其他同事;通过邓某、刘某扩展乘坐同一公交班次的其他乘客;......通过以上一系列缜密的分析,我们已经利用知识图谱平台,完成了该地区19例确诊病例的流行病学的初步调查,分析出疾病的传播模式、传播链条并且找到了所有密切接触者,通过对所有密切接触者医学检测以及隔离观察,可以及时切断传播源,阻止疫情的进一步扩散,为疾控部门提供了及时的数据支撑服务。

特别说明:以上分析过程是根据真实案例总结出来的,有关场景、人物和细节均为模拟数据。

海致知识图谱

海致知识图谱平台是基于ES、图数据库等大数据基础技术开发,集全文检索、全息档案以及关系可视化分析于一体的综合大数据分析平台,通过将海量数据的知识化、图谱化并提供简单易用的查询及分析功能,服务于金融、公安、政务等多个领域40多家大型金融机构和60多个省市公安机关。

海致智能金融知识图谱:具备强大的自然语言处理能力,包括模板识别、实体识别、情感分析等,也具备领先的关系挖掘算法引擎。有效地整合工商、涉诉、招投标等外部数据和全网一万家以上的外部数据,并结合商业银行行内数据,形成客户的多维度视图,并基于此,利用图挖掘、图分析技术,形成链状、圈状的客户群视图,生成企业投资关系、担保关系、资金往来关系等关系图谱,为商业银行提供精准可靠的营销及风控依据,助力金融行业向智能金融迈进。

海致智能公安知识图谱:公安知识图谱是海致警务大数据全栈产品中的核心系统,通过智能的数据识别和整合组件,根据数据关联、语义关联、算法关联,辅助人工高效的完成数据治理工作,将公安中各类数据,汇总融合成为人、事、地、物、组织、虚拟身份6大类实体,根据其中的属性联系、时空联系、语义联系、特征联系等,建立庞大的关系库,并汇聚了公安业务大量技战法,集成了大量犯罪和预测模型,深度挖掘潜在关联关系,实现了隐形犯罪的智能预警或群体异常关系的智能预测。

(作者邓华亮,系北京海致网聚信息技术有限公司实施部总监)

转载请注明:http://www.0431gb208.com/sjszlfa/4512.html