原创机器之心产业研究机器之能
自然语言处理技术是人工智能技术的重要分支,随着自然语言处理技术本身的日趋成熟,一套相对完善的产业链也随之建立,从而催生了一批针对于自然语言处理技术的商业化产品,自然语言处理平台就是这样的商业化产品。相较于自然语言处理技术相关的软件和硬件产品,以自然语言处理平台为主的服务类产品占据着过半的市场份额,又因其本身的灵活性而具有无限的应用潜力。本文将对自然语言处理平台的市场现状、供应链以及行业技术热点进行简单的统计和讨论,并列举不同行业领域里不同维度上的自然语言处理平台的落地应用。
作者
于琳洋、田辰
一
自然语言处理技术及其市场发展
自然语言处理技术是指将人类沟通时所用的语言信息,经过处理转化为机器语言的过程。其作为人工智能技术的重要分支,在信息处理和数据提取中占据着重要地位。自然语言处理技术拥有众多细化技术分支,例如语音识别、语音合成、语义分析等。通过这些细化技术的互相组合,其能够实现社交网络文本情感分析、客户信息挖掘等更为复杂的技术应用。从市场发展角度来看,自然语言处理技术的市场基于技术本身的进步正处在快速发展期,市场利润空间成指数级增长,到年,全球市场年收入将超过70亿美元。市场架构主要分为软件供应商、硬件供应商和服务提供商。其中,相较于提供软件或硬件等直接支持的行业解决方案,提供自然语言处理平台服务以及其他相关数据或算法服务的企业占有超过50%的市场份额。
二
自然语言处理平台架构
将自然语言处理技术付诸实践并非能够一蹴而就,从最初的词袋模型根据字段出现概率进行分析理解发展至如今基于深度学习技术的自然语言理解,其模型构建流程都包含着五个主要阶段:获取语料,对语料进行预处理,特征化,模型训练,以及之后对模型的评估与调试。这套成熟稳定的技术流程促生了成熟的集成层次,针对不同应用场景的通用性自然语言平台加速了自然语言处理技术商业化落地的脚步。
三
自然语言处理商业化现状
目前为止,自然语言处理平台的应用分布于多个领域,且通过其细化技术任务的多种组合,使自然语言处理平台的应用成功落地于众多分散的细化应用场景。热点图数据来自于整理不同领域中的离散案例并对其涉及技术进行分析,并根据应用技术及相关场景的出现频率对数据进行颜色分级,由浅入深表示其出现频率由低到高。
四
自然语言处理平台商业化案例一览
搜狗知音自然语言处理平台
凭借着搜狗互联网公司文字信息获取的天然优势以及多年来的数据和技术积累,搜狗从年开始布局自然语言处理领域,并于年推出搜狗知音自然语言处理平台。搜狗知音自然语言处理平台主要聚焦于提供模块化的产品服务以及解决方案。目前,该平台以囊括语音识别、语音合成、语音分析、机器翻译等通用模块,以便让平台用户进行自由组合,从而构建符合其行业以及业务场景的客制化解决方案。近几年,通过客户的反馈,搜狗知音自然语言平台已形成针对文体娱乐、企业服务、科研教育等领域的专有解决方案,并推出了搜狗分身,搜狗同传等泛化行业垂直领域性解决方案以加快平台用户落地脚步。目前,搜狗分身与搜狗同传在传媒、教育、金融等领域都有离散应用落地。
央视财经与搜狗合作利用搜狗知音的搜狗分身所推出的AI主播“姚小松”,是基于央视主持人姚雪松的形象和声音,用人工智能技术合成的仿真AI主播。AI主播的背后,是搜狗分身通过语音合成技术模仿真实主持人的声音,通过文本语音转化技术,实现真人般的主播发声,并结合平台上的模型优化,使唇形、面部表情等与真人完全吻合,实现主播的“克隆”。除了“姚小松”外,同样基于搜狗分身的虚拟主播不仅在传媒领域被广泛应用,还在教育、金融以及社会服务领域都有相关应用案例。
讯飞开放自然语言处理平台
年科大讯飞率先对外发布讯飞开放平台,利用本身的技术及数据优势,搭建讯飞开放平台并提供相对完善的AI产品体系,提供语音识别、语音合成以及语义理解等AI技术接入。讯飞开放平台依托本身技术优势,针对不同行业以及服务场景都推出了丰富的技术模块产品与解决方案。平台不光有成熟的技术产品模块化服务(包括语音识别、语音合成、情感分析、关键字提取等),还可针对上述模块提供对应的管理软件以及硬件等一揽子服务。目前,科大讯飞不仅正在寻求通过自然语言处理平台构建覆盖该领域上、中、下游的全套解决方案,还希望该全套解决方案可以适应如健康医疗、文体娱乐、及企业服务等传统领域,从而进一步增强平台客户的粘着性。
科大讯飞利用讯飞开放平台开发语音电子病历输入医院,通过将自然语言处理技术与前端医生佩戴的麦克风硬件对接,在医生随身佩戴麦克风时能够分析来自医生和患者交流过程中的语音信息,自动过滤无关的闲聊语句,并将病情信息结构化的录入病例表格,正常情况下,医生问完诊,病历记录也基本完成了。基于讯飞开放平台的语音电子病历系统,总体上节省医生40%的病历书写时间。该系统输入高达1分钟字,且系统内置百万级医学词汇,支持40种以上的标点符号的口述或自动生成。
Conversable自然语言处理平台
Conversable是针对与企业与客户间沟通的软件即服务(SaaS)自然语言处理平台。该平台可通过融合语义理解、文本挖掘、机器翻译以及文本生成等技术,实现多平台多维度的企业与客户对接。目前,该平台不仅可以帮助企业在不同场景下构建符合其需求的聊天机器人,还可实现评论、客户、市场监控等相关功能。
WingStop借助Conversable的自然语言处理平台,构建了适用于自身的社交媒体订餐平台。该平台不仅可以让顾客通过语音和文字完成下单、预定、缴费等多项功能,还可以帮助WingStop询问食客食品味道,过敏等相关问题以降低食品安全风险,以及食品生产成本。
吾来智能对话机器人平台
年,来也科技面向企业客户推出b端产品智能对话机器人平台“吾来”,以深度学习、强化学习、自然语言处理、光学符号识别等技术为核心,通过最领先的深度学习智能交互技术和支持人机无缝协作的系统实现,为企业提供高效专业的客户沟通解决方案;对话式用户交互,本质上是线下沟通和消费体验的线上化;从非结构化的对话中沉淀知识,基于大数据挖掘消费者洞察。帮助企业客户搭建、训练和管理对话机器人超级雇员,同时基于平台自身的核心技术,推出更直接的产业落地产品,目前具体解决方案包括营销场景机器人及客服场景机器人等。
学旅家是一个专门为全球留学生服务的海外住宿预订平台。学旅家的接待顾问通过
转载请注明:http://www.0431gb208.com/sjslczl/2793.html