新一代自然语言认知技术与文本大数据开放平台及应用系统
1、项目基本情况
本项目基于公司在大数据领域的数据及客户积累,以领先的手写识别、光学字符识别(OCR)、表单识别等人工智能图文识别技术为基石,围绕自然语言理解、大数据分析、专家系统等人工智能核心的认知及决策技术,研发新一代自然语言认知技术与文本大数据开放平台,面向智慧档案、智慧医疗、智慧司法、智慧金融、智慧教育等行业,构建行业应用平台与解决方案。同时,实现对外能力开放,支持行业用户在平台快速构建行业应用、解决方案,降低企业应用人工智能、大数据技术的门槛,助力企业智能升级。
2、项目的必要性和可行性
(1)项目实施的必要性
①顺应国家“新基建”政策导向,保持人工智能及大数据技术的先进性年4月20日,国家发改委首次明确新型基础设施的范围,主要包括信息基础设施、融合基础设施、创新基础设施三个方面,指出以人工智能、云计算等为代表的新技术基础设施和以数据中心为代表的算力基础设施等是信息基础设施的重要组成部分,同时深度应用人工智能、大数据等技术,支撑传统基础设施转型升级,进而形成融合基础设施。
新基建范围明确,对人工智能、大数据提出了更高的技术创新要求,人工智能、大数据中心成为“新基建”的关键投资方向。“新基建”通过基础数据的收集、计算、模拟、反馈等创造出更多的新市场、新需求。现在已经有越来越多的行业和技术领域对大数据分析系统有需求,例如医疗大数据分析、电子政务大数据分析、大数据分析中台等。
汉王科技顺应国家“新基建”政策导向,基于多年的技术及行业积累,尤其是在文字识别及图文处理领域的领先技术,积极布局新一代自然语言认知技术与文本大数据开放平台,对推动人工智能技术进步和应用以及数字经济建设,保持公司技术先进性,具有重要意义。
②整合公司人工智能技术优势,推动人工智能向认知智能发展
人工智能类比人类的能力,可以划分为感知智能和认知智能。目前人工智能在图像、音频、文本的识别等感知智能层次取得了巨大成功,在诸多特定任务上已经达到或超越了人类水准。但是在分析、思考、理解、判断等方面,仍与人类智能相差甚远。为了突破感知智能局限性,人工智能正在向认知智能演进。相较于感知智能,认知智能将更多基于数据,能够自动将非结构化的数据变成结构化的知识,帮助机器理解数据,学习到最接近人脑认知的“一般表达”。而自然语言理解是机器与语言之间的“桥梁”,是实现认知智能的关键技术。
公司是领先的人工智能技术公司,尤其在文本识别及图文处理领域。公司手写识别技术、OCR识别技术分别获得国家科学技术进步奖一等奖、二等奖;近年公司在语义分析、自然语言理解方面进行前瞻布局,并在全球机器问答竞赛、法研杯司法人工智能大赛等国内外自然语言技术竞赛中获得多个奖项。同时,公司持续推动文本识别及自然语言处理技术在司法、医疗、档案、金融等数据密集型行业的初级应用。在人工智能、大数据快速发展的大背景下,客户在数据智能整理、存储、价值挖掘等方面存在的大量潜在需求将被激发;本项目围绕自然语言理解等认知智能关键技术,融合大数据技术,建设新一代自然语言认知技术与文本大数据开放平台,将推动人工智能向认知智能发展。
③深化“人工智能+大数据”战略布局,助力行业数字化转型
公司是人工智能产业的先行者,在计算机视觉、自然语言处理、笔交互等领域有深厚的技术积累。同时,公司持续探索人工智能技术在知识复杂行业大数据领域的应用,已在司法、医疗、档案、金融等行业落地相关应用,并实现较快增长,大数据业务收入最近三年复合增长率达到76.44%。公司“人工智能+大数据”的战略布局,成效已初步显现。在此基础上,公司致力于打通感知与认知智能,通过多模态人工智能和大数据技术,实现具有分析决策能力的高阶人工智能应用,帮助组织构建人机协同的行业大脑,加快数字化转型。
(2)项目实施的可行性
①国家政策的鼓励,为项目实施提供了良好的政策环境支持
我国政府高度重视人工智能技术进步与产业发展,近年来出台了一系列政策支持人工智能的发展。年7月,国务院发布《新一代人工智能发展规划》,人工智能首次加入国家战略规划。此后,我国政府相继发布《促进新一代人工智能产业发展三年行动计划(-年)》《关于促进人工智能和实体经济深度融合的指导意见》等一系列产业政策以支持人工智能产业的发展。国家出台的相关政策为人工智能及大数据行业的发展创造了良好的条件,有利于促进新一代人工智能及大数据产业发展,助力实体经济转型升级,促进人工智能及大数据与实体经济的深度融合,进一步推进国家新一代人工智能及大数据开放创新平台建设,推动我国人工智能及大数据技术创新和产业发展。
②雄厚的技术积累,为项目实施奠定了坚实的基础
公司在手写识别、光学字符识别(OCR)、自然语言处理等人工智能模式识别领域拥有核心技术,并组建了近人的研发团队,在技术和人才方面具有领先优势。同时,公司与中国科学院自动化所、华北电力大学、公安部一所、公安部三所等知名院所建立专项技术研发合作,通过发挥各自优势,共同深化科技、人才、数据等资源的合作交流,逐步形成技术生态圈。公司依托本项目进行文本识别及自然语言处理技术和大数据技术的研发,具备坚实的技术和人才基础。
③巨大的产业规模,为项目实施提供了广阔的市场空间
一轮产业变革的核心驱动力,目前在图像、音频、文本的识别等感知智能领域取得了巨大成功,在诸多特定任务上已经达到或超过了人类水准,已在安防、金融、消费品、教育、交通、工业、医疗、汽车等领域落地较多应用;以自然语言处理技术为核心的认知智能技术的不断突破,将进一步打开人工智能应用的“天花板”,形成更大的产业规模,长期空间巨大。人工智能已上升至国家战略,根据国务院《新一代人工智能发展规划》,到年人工智能核心产业规模将超过4,亿元,带动相关产业规模超过5万亿元。公司依托本项目开展自然语言理解技术的研究及应用平台建设,具有广阔的市场前景。
④优质的现有客户群,为项目实施提供了良好的市场保障
公司在人工智能行业多年深耕,不断拓展目标客户群体,目前已覆盖教育、金融、政府、安防、银行、通讯、医疗、司法、汽车等多类行业客户,与行业内诸多知名公司形成良好的商业合作伙伴关系。在大数据方面,公司服务于智慧司法、智慧医疗、智慧档案、智慧金融等领域,客户覆盖医院(其中医院)、北京和天津两市的三级法院系统、全国前十大图书馆、六大国有银行及主要商业银行。依靠公司领先的技术水平、产品能力及优质的服务水平,已形成一大批具有粘性的客户基础。公司依托本项目深化、升级在大数据领域的应用,具有优质的客户基础。
3、项目投资估算
本项目总投资为41,.37万元,其中固定资产投资10,.21万元,研发投入21,.39万元。
4、项目效益预测
本项目税后投资回收期(含建设期)为4.81年,财务内部收益率(税后)为29.65%。
5、项目实施主体和实施周期
本项目的实施主体为汉王科技股份有限公司,建设周期为36个月。
6、项目选址
本项目建设地址位于北京市、武汉市。
7、项目审批情况
本项目相关报批事项正在办理过程中。
转载请注明:http://www.0431gb208.com/sjszlff/1266.html