编者按:在二十一世纪新十年开启之际,搜狐科技正式推出《中国创新公司》系列榜单及报道,围绕5G、AI,以及芯片、制造、零售、出行、社交、企业服务等领域内的技术创新和商业模式创新,对优质创新公司及相关行业进行深度价值挖掘。
目前,处于第三波浪潮的AI正在迎来加速发展,AI技术不断突破,进入应用规模爆发的临界点。年,AI还跻身“新基建”七大领域,成为各行各业数字化、智能化升级的重要基础设施,大量布局AI的科技巨头和创业公司逐渐开始涌上潮头。
在AI掀起的第四次工业革命中,谁能脱颖而出?继芯片系列榜单后,搜狐科技《中国创新公司》正式推出AI领域榜单,首期聚焦智能语音领域及代表公司。未来的一段时间内,我们还将围绕计算机视觉、机器人等细分领域进行系列策划报道,并举办主题沙龙活动,敬请期待。
出品
搜狐科技
作者
梁昌均
编辑
杨锦
6月17日,搜狐科技《中国创新公司》正式发布中国智能语音企业榜单。根据技术水平、经营状况、融资进展等核心指标,并结合业内专家审定,评选出国内智能语音行业20家代表企业。国内智能语音行业市场格局如何,这些上榜企业在技术布局和应用落地方面有何进展?榜单深度解读揭晓答案。
要点提炼:
1、全球智能语音市场呈现明显集中趋势,国内市场相对分散,且由本土企业主导;
2、榜单中初创企业达到14家,合计披露融资额近亿元,头部企业获资本追捧;
3、技术融合发展是行业趋势,机器学习/深度学习、知识图谱、AI芯片等是榜单企业在智能语音之外普遍布局的技术;
4、智能语音应用在消费级市场以语音助手为代表,企业级市场以智能客服为代表,电信、金融、电商、教育、医疗、汽车是竞争相对激烈的领域。
本文共计余字,阅读大约需要10分钟。
国内市场本土企业“唱主角”
语言是人与外界沟通最重要的纽带,被称为人工智能皇冠上的明珠。智能语音的核心是处理自然语言,即以口头语言(语音)和书面语言(文字)为研究对象,对其进行识别、理解及生成,从而使机器具备能听会说、能理解会思考的能力。
智能语音涉及多类型学科,主要包括声学信号(如声源定位、语音增强、回声抵消等)、模式识别(如声纹识别、语音识别、语种识别等)、自然语言处理(自然语言理解、自然语言生成等),以及语音合成等细分技术,囊括感知智能和认知智能两大层面,其中语音识别和自然语言处理位居人工智能七大关键技术,也是人机语音交互变革的核心支撑性技术。
智能语音主要技术方向资料来源:华西证券
人类对智能语音的探索始于上世纪50年代,迄今已逾70年。语音识别是最早进行研究的技术,年语音识别准确率在深度神经网络的帮助下达到95%,被视为首次基本达到人类水平,智能语音也加速进入技术迭代、产品升级、商业化落地的爆发期。
人工智能之父艾伦·图灵提出的“图灵测试”一般被认为是自然语言处理思想的开端。自然语言处理,是指用计算机对自然语言(如汉语、英语)的形、音、义等信息进行处理,即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作和加工,马斯克等联合创建的OpenAI发布超大的自然语言处理模型GPT-3是该领域的代表成果。
目前,全球智能语音语义市场已相对集中,龙头占据主要份额。据中商产业研究院、广证恒生等机构数据,在全球智能语音语义市场中,Nuance、谷歌、苹果、微软、科大讯飞等头部企业占有80%以上市场份额。不久前,微软斥资亿美元(约亿元人民币)收购Nuance的交易已获美国反垄断批准,完成后市场规模将进一步集中。
据FrostSullivan预测,去年我国智能语音行业市场规模约为亿元,预计年将达到亿元。但相对全球,我国智能语音语义市场格局比较分散。IDC在去年12月发布的《中国人工智能软件及应用(上半年)跟踪》报告显示,在智能语音语义应用市场,科大讯飞、百度、阿里市场份额靠前,思必驰、智臻智能等明星创企也占有一定市场份额。但前述企业合计占据份额仅有40%左右,市场竞争仍比较激烈。
我国智能语音行业市场规模增长情况(亿元)资料来源:FrostSullivan
同时,受限于中英文语义理解差异(叠加方言影响),以及中文语音语料资源匮乏等因素,海外智能语音巨头,比如Nuance、微软、苹果等市场规模较小,本土企业占据主导地位。IDC预计,随着应用场景在AI产业规模化中的重要性不断提升,未来BATH类公司将占据更高市场份额。
TOP20中14家为初创企业
从此次上榜的20家智能语音企业来看,国内智能语音企业主要分为三类:以百度、阿里为代表的互联网科技巨头;以科大讯飞为代表的技术服务商;以思必驰、云知声等为代表的深耕于垂直领域和细分场景的初创企业,这类企业最多,达到14家。
据艾媒咨询统计,截止年底,我国人工智能创业项目中处于语音识别和语义分析赛道的企业超过家,占比达10%,但其中仅有30多企业已完成B轮后融资,也就是说有87%的企业尚处于发展前期。此次上榜的14家初创企业,均完成B+轮后融资。
榜单的14家初创企业融资情况资料来源:天眼查
具体来看,有8家企业处于D轮后融资,包括思必驰、云知声、出门问问、智臻智能、捷通华声、中译语通、乐言科技、普强信息;其中思必驰在去年8元完成Pre-IPO融资,云知声去年11月冲刺科创板,但今年2月主动撤回申请,上市终止。捷通华声、智臻智能都曾是新三板挂牌企业,目前均已摘牌,不排除未来登陆A股的可能性。
从融资额度来看,这14家企业披露的融资金额合计超过亿元,其中云知声、出门问问、思必驰融资金额最多,分别达到20亿元、17亿元、13亿元,合计占到总额的比重接近43%,显示资本对头部企业的追捧明显。不少企业还获得巨头青睐,如思必驰、智臻智能、乐言科技获得阿里投资,京东持有云知声近4%的股份,捷通华声也获得百度加持。
应用多面开花,巨头抢占智能音箱入口
榜单第一梯队企业中,成立于年、脱胎于中科大实验室的科大讯飞,是我国智能语音产业的领头羊,尤其在语音识别领域占据绝对地位。年科大讯飞作为智能语音行业代表,成为首批国家新一代人工智能开放创新平台。
在技术研发上,科大讯飞强调源头创新、自主研发,目前形成以感知智能+认知智能两大研发方向,在语音合成、语音识别、语音评测、图文识别、医学影像、机器翻译、自然语言理解等多个核心技术方面均有突破。近年来,科大讯飞的技术团队规模稳定占比在60%以上,研发投入也持续增长,去年占营收比已接近17%。
科大讯飞最近五年营收和研发投入情况资料来源:公司财报
在应用落地上,科大讯飞也逐渐摆脱外界质疑,形成2B+2C双轮驱动、软硬件齐头并进的业务模式,覆盖智能硬件、开放平台、教育、城市、医疗、汽车、金融、运营商、工业等领域。年科大讯飞营收首破百亿,去年进一步增长至亿元;净利润近14亿元,同比增长66%。
搜狗也是AI领域的创新者,其在年提出了“自然交互+知识计算”的长期核心战略,持续推进语音听写、语音翻译、语音交互等技术研发。目前,搜狗主要布局AI硬件和AI交互录音,推出录音笔、手表等产品,并具备搜狗分身、搜狗同传、搜狗知音等技术和平台。
近年来,搜狗在以语音为主导的人机交互领域,推出了多款“数字人”产品。从全球AI合成主播,到全球首个3DAI合成主播,再到全球首个手语AI合成主播,是搜狗在语音交互和分身技术上的不断突破。
此外,互联网科技巨头也是智能语音领域不可或缺的角色,此次入榜的阿里、百度和小米便是其中的代表,主要业务分别体现在天猫精灵、小度和小爱同学上。天猫精灵是阿里云智能事业群于年发布的AI智能终端品牌,去年1月升级为独立事业部,成为阿里巴巴布局AIoT及内容生态领域的核心平台。
阿里、百度、小米智能语音业务平台情况资料来源:
转载请注明:http://www.0431gb208.com/sjszlfa/6811.html