(报告出品方/分析师:天风证券研究所/缪欣君,本报告pdf版获取方式见文末)
海天瑞声是国内领先的训练数据提供商。主要从事训练数据的研发设计、生产及销售业务。凭借丰富的技术积累和行业经验,公司已成为同时具备核心技术、产品资源、优质客户为一体的本土训练数据提供企业。公司主营专业数据集,致力于建立技术壁垒。海天瑞声位于中国语音类基础数据服务领域首位。
一、海天瑞声:训练数据专业提供商
1.1公司概况:国内领先的训练数据专业提供商
公司名称:北京海天瑞声科技股份有限公司(BeijingHaitianRuishengScienceTechnologyLtd.)
成立日期:年05月11日(北京)年,贺琳和俞舸签署《北京海天瑞声科技有限公司章程》,共同出资设立海天瑞声有限。根据该章程,海天瑞声有限注册资本为30万元,其中,贺琳以货币出资27万元,占注册资本的90%;以货币出资3万元,占注册资本的10%。
1.2主营业务:致力于为AI产业链的机构提供专业数据集
公司主营业务:公司主要从事训练数据的研发设计、生产及销售业务。公司相关产品和服务主要应用于软件和信息技术服务业。
公司始终贯彻培养自身研发核心技术为要领,通过基础研究与实际应用的紧密结合,自主开发了一体化数据处理平台,在基础研究、平台工具、训练数据生产三个维度均积累下核心技术,并且以前瞻性的专业数据集设计能力、丰富的语言覆盖能力及场景采集能力,以及AI辅助标注及精细标注能力共同搭建起训练数据开发一站式解决方案,大幅提升开发效率、服务质量及数据安全性,为下游客户提供高质量的训练数据产品、高效率的训练数据定制服务及高水准的训练数据相关应用服务。
1.3业务类型:公司主营训练数据业务,细分为三条产品业务线
公司专注于为AI产业链上的各类机构提供算法模型开发训练所需的专业数据集。公司提供的训练数据覆盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个核心领域,全面服务于人机交互、智能驾驶、智慧城市等多种创新应用场景。
公司研发生产的训练数据主要运用于人工智能算法模型开发训练,产品服务形式包括训练数据定制服务、训练数据产品及相关的应用服务。
1.4财务基本情况:总体营收与净利润保持稳定
总体营收较年涨势明显:-年总营业收入分别为.77万元,.81万元和.4万元,年至年同比增长率为23%,三年净利率分别为34.84%,34.34%和35.17%,总体净利润较为稳定。
净利润涨势与总营收表现持平:-年,海天瑞声净利润分别为.07万元,.68万元和.1万元,年至年同比增长率为22%。
1.4财务基本情况:毛利率保持稳定,均超过65%
公司毛利率保持稳定,已将近70%。-年毛利率分别为64.77%,70.25%和67.70%,公司的训练数据产品业绩稳扎稳打。
1.5收入拆分:训练数据产品国内营收创新高,占比逐步回升
公司营收主场为国内地区,年国内营收涨幅较高。年至年公司国内营业收入同比增长率已上升至25.01%。-年国内总营业收入分别为.77万元,.75万元,.83万元。
公司海外业务收入年增幅明显,营收占比已恢复如初。-年,海天瑞声海外营收分别是万元,.07万元,.56万元,占总营收比重分别为31%,50%,36%,年海外收入受疫情影响,占比浮动较大。
1.5收入拆分:数据库产品服务收入占比逐年升高,已达46%
公司核心来源为数据资源定制服务,年占比约50%。定制服务产品营收较为稳定,年至年销售额分别为.55万元,.91万元,.91万元。
公司数据库产品服务占比在逐年上升,营收占比将与数据资源定制服务相持平。-年该项服务营收分别为.67万元,.47万元,.71万元,占总营收比重分别为34.27%,38.63%,45.48%。
公司数据库资源相关服务占比小幅提升。年至年占总营收比重由1.53%增长为4.26%。
1.6费用分析:持续增大研发投入,不断筑高技术壁垒
重视研发团队建设,研发技术人员比例几近70%。截止年12月31日,公司总人数人,研发与技术人员数量达人,占公司总人数比例达68.21%。
筑高技术壁垒,高研发费用。公司-年研发费用分别为.32万元,.61万元和.75万元,占总营业收入的比例分别为14.19%、17.55%、18.64%,公司-年的研发费用逐年递增,占营业收入比重皆超过10%,现已高达至19%。
1.7高管技术团队:拥有名校背景及知名公司经历
1.8客户情况:前五大客户销售占比超50%,老客户群较为固定
国内主要客户小幅变动,境外收入因年而异:公司客户销售占比情况逐年更替,海外市场主要客户变动明显,微软销售占比逐年增高,三星销售额陡然递减,由年.96万元缩减至年.66万元。
前五大客户销售占比超50%,老客户较为稳定:-年前五大客户销售占比皆超过50%,且不存在依赖特定客户的情形,-年,微软、阿里巴巴、腾讯、三星稳定居于公司前五大客户,微软于年为公司第一客户,营业收入占比18.56%。
二、公司主要产品:训练数据服务
2.1主要产品:训练数据专业提供商—训练数据定制服务
公司是我国人工智能领域标杆企业,在基础数据服务行业具备高影响力。训练数据定制服务为专属客户单独研发,客户将享有最终生成的训练数据的知识产权,公司不可将此类业务生产的训练数据向其他客户重复销售。
此项产品服务将根据客户定制化需求,优先按照初始计划生产部分数据,客户通过后续反馈方案决定是否更改数据定制需求,并重新确定新的解决方案。
2.1主要产品:训练数据专业提供商—训练数据产品
公司开发自有知识产权的训练数据产品,通过销售训练数据产品的使用授权许可,获取让渡资产使用权收入。此类训练数据集一经开发完成,公司可多次销售并获取授权许可收入。
2.1主要产品:训练数据专业提供商—训练数据相关的应用服务
公司基于其生产的训练数据提供算法模型相关的训练服务,运用训练数据研发能力助力下游客户完成其算法模型的语言拓展、特定算法模块拓展、垂直应用领域拓展等,为客户定制针对特定应用场景的专属算法模型,提高AI技术应用效果。
2.2主要应用技术:训练数据专业提供商—三大AI核心领域
公司提供的训练数据广泛应用于众多主流AI产品及终端应用的训练过程中,覆盖了个人助手、语音输入、智能家居、智能客服、机器人、语音导航、智能播报、语音翻译、自动驾驶、智慧交通、智慧城市、机器翻译、智能问答、信息提取、情感分析、OCR识别等多种应用场景。
2.3主要业务流程—采购流程
2.3主要业务流程—数据服务采购执行与销售流程
三、行业分析
3.1中国人工智能基础数据服务行业的的产业链图谱
3.2AI基础数据服务行业发展态势:国家产业政策助力行业稳步发展
3.3人工智能行业市场规模:市场规模持续增长
全球人工智能市场规模稳定扩张。基础数据服务行业人工智能行业发展情况息息相关,在近年来全球AI产业基本保持稳定向好的发展态势下,年至年复合增长率将提升至21.73%。
国内人工智能市场规模持续增长。截至年年末,中国(不含港澳台)活跃AI企业达到1,家,占全球总数的22.08%,位居全球第二;年,中国人工智能行业的融资总额约为亿美元,占全球的44.39%,位居全球首位。
3.4AI基础数据服务行业市场规模:人工智能市场扩张带动发展
全球人工智能行业高速发展助长国内AI基础数据服务行业市场规模扩增。公司营业收入受益于中国AI基础数据服务行业市场规模稳步增长,年市场规模预计达36亿元,增长率常年稳定于20%。
当前我国人工智能产业加速发展,从基础支撑、核心技术到行业应用的产业链条基本形成,一批创新活跃、特色鲜明的创新企业加速成长,新模式、新业态不断涌现,整体呈现蓬勃发展态势。政策支持、投资引导和巨头布局将推动中国AI产业的结构调整,进一步扩大市场规模。
3.5AI基础数据服务行业数据量:训练数据总量高速增长
全球数据量呈指数型增长。据国际数据公司(IDC)预测,全球每年的数据量将从年的33ZB快速增加到年的ZB,年复合增长率达26.91%。其中,中国的数据量增速最快,平均每年的增长速度比全球快3%。年,中国的数据量为7.6ZB,占全球总量的23.4%,预计到年将增至48.6ZB,占全球总量的27.8%,年复合增长率达30.35%。
3.6AI基础数据服务行业市场需求:训练数据需求增长
全球基础数据服务行业处于快速成长期,市场规模具有较大的增长空间。应用场景的创新和机器学习算法的流行直接带动了训练数据需求的大幅增长,得益于训练数据需求增长和对外采购意识的形成,全球基础数据服务行业进入快速成长期,市场规模具有较大的增长潜力。
3.7AI基础数据服务行业竞争格局:训练数据供应集中化
中小数据供应商是市场中的主要供应力量。品牌数据服务商、中小数据供应商和需求方自建基础数据团队构成市场竞争关系,为基础数据服务市场的主要供应方,在年市场规模中的份额占比分别为30.4%、47.0%和22.6%。未来随着训练数据的难度和精度要求越来越高,及对数据安全的要求越来越严,有向品牌集中的趋势。
中国基础数据服务行业的市场需求可以分为图像类数据需求、语音类数据需求和自然语言处理类数据需求。年,图像类、语音类和自然语言处理类数据需求规模占比分别为49.7%、39.1%和11.2%。
3.8公司市场地位:中国语音类基础数据服务领域首位
公司是中国语音类基础数据服务领域的头部企业,在中国语音类基础数据服务领域企业中营收份额占比排名第一。中国基础数据服务行业提供语音类数据产品和服务的供应门槛高于图像类数据,行业内的主要企业由AppenLimited,AIMMO,Baobab,Globalme,DefinedCrowd,ScaleAI,慧听科技,标贝科技组成。
3.8公司市场地位:公司市场份额约8%,行业排名前五
中国AI基础数据服务行业仍处于低集中竞争阶段,行业活力充足,发展空间较大。现阶段国内基础数据服务商以提供图像类数据和语音类数据服务的公司为主。图像类数据业务内容涉及人像数据、OCR数据、自动驾驶数据等,百度众包在图像类基础数据服务领域的营收份额占比最高。
语音类数据产品和服务的供应门槛高于图像类数据,业务内容包含语音识别数据、语音合成数据等,海天瑞声在语音类基础数据服务领域的营收份额占比最高。
四、风险提示
市场竞争加剧风险:公司所在的细分领域为人工智能基础数据服务领域。公司竞争对手不断增多,导致市场竞争加剧。公司如果不能持续有效地制定并实施业务发展规划,则将受到竞争者的挑战,从而面临市场竞争加剧而导致的经营状况下滑、市场地位下降和可能失去主要客户的风险,进而影响公司的盈利能力和发展潜力。
收入主要来自老客户,新客户收入占比较低的风险。
专利被申请宣告无效的风险。
核心技术快速迭代风险。由于人工智能行业整体发展较为迅速,应用领域和应用场景不断拓展,下游需求随着行业发展不断发生变化,公司进行数据开发所需的各项技术也面临着快速迭代更新的风险。
核心技术人员流失风险。随着行业的持续发展,行业内企业之间对于高端人才的竞争日益激烈,如果公司无法持续加强核心技术人员的培养及引进并为核心技术人员提供有竞争力的激励机制和薪资待遇。
核心技术失密风险。
采购成本上升风险。
数据安全相关风险等。
获取本报告pdf版请登录
转载请注明:http://www.0431gb208.com/sjszjzl/4357.html