人工智能正成为未来全球科技突破的重要方向。回顾其发展历程,美国在人工智能过去三个重大突破阶段都占据主导地位。以ChatGPT为代表,人工智能突破性创新出现新一轮快速增长,但我国似乎仍扮演跟随者角色。为了探究中国在人工智能领域的突破性创新能力究竟如何,本文基于论文发表这一主要的创新成果形式搭建人类知识网络,从影响力和原创性两大特征出发,构造突破性指数,刻画中国的创新能力与国际差距。
我们发现,总量上,中国人工智能的论文发表量在年反超美国成为全球第一,突破性论文发表量在年升至全球第二、年国际份额达17%;结构上,中国在模式识别、计算机视觉、数据挖掘、语音识别领域的突破性表现尚可,而在算法、自然语言处理和人机交互领域相对薄弱。国际对比来看,中国相较除美国以外的其他国家积累起一定的突破性创新优势,中美突破性创新的差距逐步缩小、但仍然较大。大国竞争下,中美人工智能论文的合作比例在年后出现下滑,但并未对我国突破性创新造成很大的消极影响,与美国的突破性论文合作份额被其他国家取代。
中国人工智能突破性创新的痛点在哪?第一,我国科研机构在人工智能的论文发表量上占据半壁江山,但论文量多质低、良莠不齐,全球百强突破机构榜上仅有十席。第二,我国人工智能领域的科研人员数居于全球首位,并在不断增长,但由于缺少顶尖科研人员,这一规模优势还未充分转化为突破性创新能力。第三,在人工智能的突破性研究中,商业机构的缺位很可能也是我国在商业应用导向的人工智能突破性创新上难以领先的重要原因。
年11月0日,OpnAI发布对话式大型语言模型ChatGPT,在2个月内用户量破亿,被称为“人工智能领域的里程碑[1]”。年2月8日,集成了ChatGPT语言模型的搜索引擎新版“必应”上线,响应效率显著提升;月15日,该公司随即发布更为完善的多模态预训练大模型GPT-4,较ChatGPT进化出读图和长内容生成等能力[2]。
这些应用发明使人工智能在应用广度和智能程度上都取得重大进展,能够通过多个行业的入门考试[],并在人机交互中深刻理解用户意图。由此掀起的人工智能浪潮中涌现出大批初创企业,而头部科技大厂之间的竞争也进入白热化,Googl的Bard、百度的“文心一言”、Anthropic的Claud、Quora的Po接踵而来。回顾人工智能领域的历次突破,中国似乎一直处于创新跟随者的地位,我国在人工智能领域的突破性创新能力究竟如何?
突破性创新是开拓认知边界、引领未来创新活动的重大创新成果。论文发表因其良好的可比性、客观性和科技相关性,被主流国际机构当作衡量创新成果的重要指标[4]。
围绕突破性,本文基于论文发表搭建人类知识网络,从影响力和原创性两大特征出发,构造突破性指数[5]来度量每篇论文的突破性程度,将各年度内排名前1‰的论文认定为突破性论文,并根据作者在发表年份所属机构的国别按作者人数计算贡献比例,以评估中国在人工智能领域的突破性创新能力与国际差距。
一、人工智能是未来科技突破的重要方向,中国创新落人一步?人工智能正成为未来全球科技突破的必争之地。在不同时代,人类在知识领域实现突破性创新的重点学科并不相同。从学科结构来看,数理化学科在20世纪中期前是科学研究的主要领域,建立了相对论、量子力学和原子核结构等理论基石,而随着基础框架的建成和研究转向技术应用,其突破高发期似乎已经过去,突破性成果越来越多地出现在医学和计算机学科(图表1)。其中,后者作为突破份额位列第一(0%)且保持长期增长态势的领域,其论文发表经历了过去一个世纪的稳步积累,在信息时代一跃成为强势学科。随着硬件性能提升、数据的指数型增长,以及深度学习等技术的不断发展,人工智能在计算机学科中的地位越发凸显,突破性论文的份额快速上升至计算机领域的8%、全领域的11%,不仅可作为技术基础大幅提升效率、降低成本,还在自动驾驶、智能家居、医疗健康和金融风控等众多领域具有广阔的应用前景。此次ChatGPT正是人工智能领域的一次重大突破,其定位于通用任务助手,背后的AIGC技术颠覆了现有的信息获取与人机交互方式,对搜索、推荐、内容生成等工业流程都产生了深远影响。受政策支持和市场竞争推动,人工智能的突破性创新趋势或将长久持续,AI与人类社会的深度融合已是必然。
图表1:数理化逐渐式微,计算机医学快速突破
资料来源:MicrosoftAcadmicGraph,中金研究院
回顾人工智能的发展历程,美国过去三个历史阶段的学术突破中都占据主导。自年美国科学家提出“人工智能”的概念以来,该领域的发展历程可划分为三个阶段[6]:20世纪50-70年代,人工智能的学术研究尚处于启蒙期,致力于解决机器定理证明、代数应用、语言翻译、几何证明等初级任务;20世纪70-90年代出现了知识库和推理机等形式的专家系统,推动人工智能由理论研究走向实际应用,知识创新也随着新技术的开发和应用场景的增加而增长;20世纪90年代后,机器学习和深度学习技术使人工智能得以解决更为复杂的问题,同时数据共享和代码开源促使论文数量出现指数级增长。
然而,根据欧盟委员会总结的各阶段的重大学术突破(图表2),其中绝大多数都来自美国机构的学者。年人工智能知识创新出现新一轮快速增长,基于无监督学习的大规模语言模型使阅读理解、机器翻译、问答总结等无特定任务的训练得以高性能地完成,同时科技大厂加速研发出品,以抢占新市场、夺得制定规则的话语权,这或标志着人工智能正在进入第四个“类人交互”的新阶段。
图表2:人工智能领域的全球论文发表数与重大学术突破
资料来源:欧盟委员会,中金研究院
就突破性而言,近年来我国的人工智能发展似乎总是跟随着美国的脚步。人工智能曾被认为是“几百年来中国第一次与世界前沿的发达国家站在相同起跑线竞争的难得机会[7]”,其作为快速迭代的近代学科,以显著短于能源、制造等领域[8]的知识创新成果转化和商业化周期[9]迅速落地,似乎让各国看到了“弯道超车”的希望。
然而,现实中人工智能领域的赶超并不容易,在技术、数据、人才、资金和产业生态方面都具有很高的壁垒。近年的绘图师DALL·E和图文对比器CLIP等具有革命意义的突破性创新,均发生在谷歌和OpnAI等外国科技公司,中国公司虽然也紧随其后地推出了类似的产品,却无法超越领先,且可能在性能水平、参数规模、样本容量上还略逊一筹(图表)。
图表:以通用人工智能ChatGPT为代表,我国在人工智能的突破性方面较为落后
资料来源:各公司
转载请注明:http://www.0431gb208.com/sjszjzl/8008.html