毕业论文
您现在的位置: 语言识别 >> 语言识别介绍 >> 正文 >> 正文

百度AI十年第二增长引擎的蜕变

来源:语言识别 时间:2023/4/27

3月23日的演讲中,李彦宏将回港上市定义为百度的“二次创业”。

对于百度来说,“二次创业”的说法绝非虚辞。年冲刺纳斯达克时,百度还是一家纯粹的搜索引擎企业;时隔十六年后帮助百度叩开港交所大门的,则是深耕了十年之久的人工智能,百度已经彻底成为一家AI生态型企业。

犹记得在年5月举办的第二届数字中国建设峰会上,李彦宏在阐述百度AI的愿景时打了一个形象的比方:“互联网是前菜,它的特点是快;人工智能才是主菜,需要温火慢炖,但营养丰富。未来没有一家企业可以声称与人工智能无关,吃不到这道主菜,将失去一个时代。”

借着百度二次上市的契机,似乎有必要重新梳理下百度AI的十年历程,如何从不被外界注意的新事物,逐步蜕变为百度的第二增长引擎,并帮助百度提前锚定了人工智能时代的市场站位。

鉴于篇幅的原因,本文主要分为四个章节。

01育种

年,神经网络专家Hinton和他的两个研究生将神经网络应用于语音的声学建模,与行业内流行了30年的标准工具一较高下,在小词汇量连续语音识别数据库TIMIT上,获得了语音识别竞赛胜利。

于是深度学习像是打开了闸门的洪水,迅速从语音识别、图像识别延伸到机器翻译、语义理解等领域,极短的时间里就成了学术圈的主流。彼时中国互联网还处于PC时代,流量红利犹在,太平洋对岸的热闹未能触动太多企业,人工智能的应用还只是停留在科幻电影里的虚幻场景。

百度可能是国内最先“觉醒”的互联网巨头,在年初率先成立了“自然语言处理部门”,尽管最初的目的是为了服务搜索中产生的智能化需求;接下来不断在语音、图片等技术上布局,并敲定了在知识图谱技术上长期投入的战略。

到了年的时候,百度的AI战略已经初步成型,陆续成立了深度学习研究院IDL、人工智能实验室。年百度开始涉足智能驾驶领域,先后推出了深度语音系统、百度大脑、度秘、Apollo自动驾驶平台等技术体系,涉及自然语言处理、机器翻译、语音、视觉、机器学习、深度学习、知识图谱等核心技术。

也正是从年开始,百度的研发费用进入稳步增长期。研发投入在营收中的占比,从早期的不足10%跃升到年的21.4%,十年间的累计研发费用高达亿元。甚至有好事者进行过这样一组对比:年进军人工智能后,百度的营收增长了14倍,研发费用的增长却超过25倍。

上千亿的研发资金似乎并未直接利好百度的营收,但带来了远比一时的利润更有价值的硬实力:

根据国家工业信息安全发展研究中心发布的《人工智能中国专利技术分析报告》,在人工智能专利申请量和授权量方面,百度以件专利申请和件专利授权位居第一,并在深度学习、智能语音、自动驾驶等领域占据首位。

仅在年期间,百度被国际AI顶会收录的论文达到多篇,在CVPR、ECCV、NeurIPS、INTERSPEECH等全球顶级的人工智能学术会议或相关竞赛上,百度AI问鼎冠军近30次,斩获了多个行业权威奖项。

沉甸甸的数字背后,百度就像是一位劳作在田间地头的“育种师”,亲手开辟了一块又一块的试验田。在外界沉迷于追逐风口疯狂扩张的时候,百度的速度看起来有些“落后”,但育种师清楚的知道这些种子的价值在哪里

02散播

年,人工智能的浪潮终于走出学术圈。在某场著名的公关事件后,人工智能逐渐成为大家茶余饭后的谈资。或许很多人对人工智能的应用依旧陌生,但人工智能的进化速度彻底刷新了人们的传统认知。

原本痴迷于移动互联网船票的中国企业逐渐意识到,属于人工智能的时代已经不再遥远,倘若和新的技术浪潮失之交臂,结果可能是灾难性的。现实的残酷在于,根据第一财经等主流媒体的报道,中国AI人才的缺口可能有万的规模,并将随着人工智能的产业化进程逐年增长。

百度开始有意调整自己的姿态,从默默深耕的“育种师”,思考怎么将前沿的人工智能技术散播出去,避免重复造轮子等问题。

年9月的百度世界大会上,集视觉、语音、自然语言处理、知识图谱、深度学习等技术于一体的百度大脑正式对外开放,并且每隔一段时间就会进行迭代,合作伙伴可以直接调用百度AI的核心能力。

同样是在年,百度主导的深度学习框架PaddlePaddle(飞桨)上线,涵盖了深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件,填补了中国开源深度学习框架的空白。

在云计算的战场上,百度率先提出了“ABC”战略,将人工智能(AI)、大数据(BigData)和云计算(Cloud)融合在一起,将视觉、语音、语义理解等擅长的AI能力通过云计算服务带到了企业级市场。

即便是不被外界重视的人才培养方面,百度在年与西安交通大学联合开设了人工智能班,与中科院大学在人才培养、科学研究、数据开放、资源共享等方面达成合作,开启了产学研一体化的篇章。

数据再一次证明了百度的远见。

目前百度大脑已经对外开放多项AI能力,日调用量超过1万亿次;百度飞桨凝聚了万开发者、服务了10万家企业、创建了超过34万个模型;截止到年底,百度总计为社会培养了超过万AI人才……

更加有说服力的是百度创新的业务孵化。年之前百度的业务主要集中在移动互联网的领域,目前已经形成了以AI为核心的生态布局。比如信息流已经是百度移动生态的核心组成,小度的月交互次数已经达到75亿次,Apollo旗下的Robotaxi和Robobus在国内多个城市接待的乘客数量已经超过21万。

回头来看,将AI的种子散播出去注定了百度作为AI生态型企业的定位,毕竟技术只有落地才能发挥其最大的价值。

03生根

年,外界对人工智能的讨论进一步从技术范畴延伸到社会趋势。理查德·利普西在《经济转型:通用技术和长期经济增长》中提出了一个重要的观点,即社会经济的持续发展是靠通用技术的不断出现而持续推动的。

正如蒸汽机的出现开启了近代工业文明,内燃机和电磁叠加构筑了现代工业体系,基于电磁技术的半导体催生了计算机、智能手机,打开了互联网组成的信息文明……几乎每一项通用技术都对人类的生活方式产生了彻底的颠覆和改变,而人工智能恰恰是理查德·利普西总结的26种通用技术之一。

百度对人工智能的价值有着自己的思考,比如百度CTO王海峰不止一次在演讲中强调这样一个观点:人工智能技术已经有了标准化、自动化和模块化的特征,具备了进入工业大生产阶段的一些基本前提,将是第四次工业革命的核心驱动引擎。

除了对人工智能价值的布道,百度开始从两个维度推动人工智能技术走向生产的第一线,在落地应用的过程中生根发芽。

第一个维度是百度的组织架构改革。

大约从年开始,百度就开始整合人工智能体系,在年下半的一次架构调整后,王海峰开始统管AIG、ACG和TG三块业务,百度AI的打法也进一步清晰,云计算被定义为智能基础设施的底座,同时将人工智能和底层技术能力灌输到底座中,进而成为赋能各行各业的“动力工厂”。

到了年初,百度再次夯实了自身的人工智能战略,从“AI+云”的整合过渡到云智一体的新阶段。

第二个维度是业务层面的持续升级。

百度大脑6.0在核心技术和产业应用两个方面全新升级,进化为软硬一体的“AI大生产平台”,成为各行各业赋能的“AI新型基础设施”;百度飞桨确立了向下对接芯片,向上支撑各种应用的定位,主动担纲智能时代的操作系统;百度智能云推出了AI-Native云计算架构,云和AI有了深度的融合。

选择将云智一体作为进化方向,初衷可能并不复杂:只有降低了产业应用的门槛,技术的商业潜力才会逐步兑现。

如果对人工智能的产业落地有所

转载请注明:http://www.0431gb208.com/sjszlfa/4348.html

  • 上一篇文章:
  • 下一篇文章: 没有了