毕业论文
您现在的位置: 语言识别 >> 语言识别优势 >> 正文 >> 正文

傅盛AI让机器有了人类的感知全链条AI技

来源:语言识别 时间:2022/11/19
白癜风治疗目标 http://m.39.net/pf/a_4632170.html

11月8日,猎豹移动董事长兼CEO傅盛出席第五届世界互联网大会“物联网:连接无处不在”论坛,并发表题为《真开放·全链条AI技术赋能物联网》的主题演讲。

(图为猎豹移动董事长兼CEO傅盛)

傅盛表示,即便是在今天的生产线上,也很难解决设备智能化的问题,而AI让机器第一次拥有了人类的感知能力,也让物联网终端更聪明。这是一个巨大的分水岭,使得AIoT的概念开始出现。在行业和自身的变革背景下,猎豹移动携旗下人工智能公司猎户星空,研发了包括语音识别、视觉识别、室内导航平台等在内的行业唯一全链条AI技术。

他说到,“我们未来不会单做一款硬件,我们致力于打造AI赋能的云端操作系统,跟开发者一起做更多的物联网设备。”

以下是演讲全文:

首先,我花一点时间介绍一下猎豹移动。猎豹移动是一家经历过三次跨越的公司,年由我自己创办的可牛影像和金山安全合并而成。

当时我们经历的第一波是PC杀毒软件免费化,实现了第一次的增长。

第二波在移动互联网的时候,我们碰到了强大的对手,决定出海。我们是第一家大规模的把用户做到海外的中国公司。今天,猎豹移动大概有5亿多的月度活跃用户,其中80%来自于海外,完全走出了一条不一样的曲线,我们内部叫做“天外飞仙”。所以我们现在依然是Google工具排行榜的第一,我们游戏的下载次数在全球接近20亿次。

第三波是在年上市以后。我当时就意识到,整个移动互联网的风口将尽,我们需要寻找下一个机会。我们在硅谷、以色列都投资了基金,由此看到了人工智能的机会。

AI让机器拥有感知能力全力以赴打造全链条AI技术

我对人工智能有一些自己的理解和思考,我们讲了很久的物联网、智能硬件,其实在AI或者人工智能出现之前,所有的智能硬件都是伪智能硬件。那个时候的智能硬件本质上是联网硬件,你要掏出手机进行操作。大概在三五年前,各种智能硬件的行业都起来了,但是很快这个行业又衰落了。

我甚至想要把机器人行业划分成两个分水岭。在AI出现之前的机器人本质上都是自动化机器,没有人的属性。我们看产线上那么多漂亮的机械手,其实都是通过非常原始的编程和自动化的设备进行生产的。即便今天在生产线上,也很难解决智能化的问题。

但AI出现以后,第一次让机器有了人类的感知能力,我们以前的摄像头看到的都是等一串数字,但今天摄像头看到的是人脸;以前看到的语音是波形,我们现在看到的语音是文字。

机器开始有了人类的感知能力,使得AIoT的概念开始出现,看到这个机会以后,我们就去做了行业唯一的全链条AI技术。包括语音识别、视觉识别、导航、机械臂、麦克风阵列等,为什么要做呢?

这是从内外两个方面思考的。

第一个,猎豹移动在以前做的太快了。我们就做一个小工具,居然就上市了。后来等到Google发政策不让我们做工具,手机厂商都开始自己做工具的时候,我们的日子就变得很艰难。所以我当时就想,拥有自己的底层技术很关键。

第二个,因为AI行业还处于早期。很多技术都不完善,或者没有形成产业分工。但很多开发者,拿一块板子,拿一个所谓的开放平台,就想实现很好的语音识别效果,其实是非常难的。以智能音箱为例,换一个外壳罩上去,算法就得调整,因为混响不一样。就像,在你的耳朵上加一个耳塞,听力就可能大幅度下降,和你的大脑聪不聪明没关系。所以整个人工智能产业的链条都非常新,又没有足够的分工。

第三个,我意识到,AI其实并不算是一个不可逾越的黑科技。很多人都说,BAT才能做AI,或者人家的积累更好一点。但是今天看来,开源代码会远远丰富于任何一个时代。很多大洋彼岸的论文出现之后,中国的工程师就很快把它实现了。所以,好处就在于,AI大大降低了技术壁垒。而且AI使得以前很多公司的积累变得无效,大家处在同一起跑线上。我们认为,这是一个弯道超车的好机会。

所以,我们当时就下定决心,把所以技术全都干了一遍,全力以赴打造全链条AI技术。全干一遍的好处就是,我们能够自主调整很多细节。

语音交互实现了命令的自然化可能颠覆手机的中心地位

我认为真正有智能的第一个硬件品类,应该是智能音箱,我一直在想,语音识别是什么东西?今天有人谈“语义理解能力超过人”。只要看到这种标题,基本上都是骗子。

为什么这么说?在语义的理解上,AI离人有巨大的差距。因为语言是人类超级牛的发明,你能够把你对世界的理解,压缩成一串很短的文字输入给对方,对方听完以后,能把这个图像、事件还原出来,这是个相当牛的能力,人类之间的交流是带有巨大的信息压缩和背景知识的。

所以,今天机器完全做不到。AI想在阅读理解上超过人类,那是在一个很有限的短文章里,没有实际意义。

真正的语音操作是什么?我认为它的本质是实现了命令的自然化。乔布斯有一句话说,每一次交互操作的演进都是一次革命。苹果有幸抓住了两次革命,第一个是抓住了键盘和鼠标,第二个是抓住了触摸屏。

今天的手机不是因为它有多么智能,而是因为它有强大的处理能力,你可以非常方便地touch。所以手机立刻取代了以前的PC、电视,成为了你的中心位置。

但语音使得手机的中心位置有可能被颠覆掉,你想象一下,语音是什么?比如,你想看《延禧攻略》,以往你需要从口袋里掏一个东西,解锁、搜索,未来可以用语音就直接唤醒:我想看《延禧攻略》。

我甚至认为,虽然手机还是个非常关键性的设备,但下一代设备都可以变得去手机化。

两年前,我们是业内第二款做智能音箱的厂商。我们(联合喜马拉雅)做了一款小雅音箱,当时很多人就问我,智能音箱有多智能呢?我回答:你不要考虑它有多智能,你只要考虑它是个摇控器,能够非常简单地点歌、了解天气,设置闹钟。我们买来了对手的产品,我们发现点歌根本点不准,只有50%的准确率。为什么?不是语音识别的问题,而是内容上的问题。比如说今天抖音出了个神曲叫《我们一起学猫叫》,你的曲库里得有这首歌。有的时候用户说叫“学猫叫”,有的说喵喵喵,有多种的说法。这不是一个智能的活儿,这是个产品的活儿。

所以我们就把音乐的点播率和内容的点播率,这一件事儿做好了。当时,我觉得智能音箱的核心不是它有多智能,而是一种新的交互模式。这种新的交互模式本质上就是一个摇控器,它把极其复杂难用的摇控器给改掉了,这个进步是非常巨大的。

iPhone刚出来的时候,大家说这个没有全键盘、没有硬键盘怎么用,输入内容太慢了。但就是因为它方便,你可以容忍它非常多不够快速的地方。

我们赋能了很多物联网的中枢,我坚定的认为,语音是下一代操作系统的界面,它一定可以使得物联网的很多设备变得智能。可以跟你直接交互,不需要通过手机APP的方式,它自己就被赋能了。我们跟很多厂商合作了很多款音箱,因为我们觉得打音箱上的战役可能打不过,但是合作是有机会的。

人工智能不会颠覆人只要一点突破就会带来变革

我们还做了一款能移动的售卖机——零售机器人豹小贩,它会主动问你是否需要商品,用户扫描

转载请注明:http://www.0431gb208.com/sjszjzl/2443.html