毕业论文
您现在的位置: 语言识别 >> 语言识别介绍 >> 正文 >> 正文

专访智能360语音助手联合创始人李传丰用

来源:语言识别 时间:2023/2/25

作者/赵方舟编辑/冯寅杰(本文原载于《创业人》杂志原标题《用声音给世界启发——专访智能语音助手联合创始人李传丰》)

智能,是由一个团队成员平均出生年代为的年轻团队开发的智能语音产品。正如“百度更懂中文”一样,较之Siri,智能绝对“更懂中文”。

在Android平台上,一方面其工程师出来对Siri产品表示不屑一顾,一方面对语音识别技术重点布局。其实,语音技术非常复杂,表象繁多。可以说,Siri的出现将人类带入了一个人工智能的时代。

在北京微冷的初春,记者见到了智能联合创始人李传丰。今年刚刚研究生毕业的他却已经和团队的核心创始人何永创过一次业了。

“我们是同学,何永创业的经历更多。首次创业失败,我就回学校念研究生去了,而他还在坚持。”智能的团队由一群典型85后组成。

人工智能,不仅仅是语音

如果你看过大导演斯皮尔伯格的好莱坞电影《AI》,相信会对人工智能有一定了解,通过人工智能技术,机器人可以把“对话、自然语言理解、视觉、演说、机器学习、制定计划、理性思考、服务代表全部融合到一起”。

如果认为智能只是一个简单的声音控制软件,那你就错了。和iPhone上的Siri一样,智能的目标正是人工智能。在安卓手机上,打开智能,就能够自主分析用户发出的口语指令,并给出确切的回应,完全不需要用户预先学习使用方法。

智能能够明白你所说的,了解你的意思,甚至还能回答你的问题。被称为安卓手机上的私人助理,无论你用何种方式提问,大多数时候它都能够给出较为准确的回答,表现出一定的智能性。

打开智能软件,主界面仅有一个麦克风按钮,一切语音操作都由这个麦克风按钮来开始。他对手机问道:“今天天气如何?”屏幕上立刻显示出今天的天气状况。他又接着问:去国贸的路线?智能马上调用谷歌地图,展开路线定位。

随后,他还用这款应用演示了备忘、发短信、打电话、查询天气、应用管理、百科知识、媒体播放等众多智能功能。

技术种类繁多,困难重重

早在计算机发明之前,自动语音识别的设想就已经被提上了议事日程,早期的声码器可被视作语音识别及合成的雏形。而年代生产的“RadioRex”玩具狗可能是最早的语音识别器,当这只狗的名字被呼唤的时候,它能够从底座上弹出来。

近二十年来,语音技术取得显著进步,开始逐渐从实验室走向市场。相比语音识别而言,自然语言处理这一块难度更高。许多大公司如IBM、苹果、微软、Google等早在多年前就对语音技术尤其是语义理解的民用化研究投以巨资。在国内,科大讯飞在语音识别及合成领域处于领先地位,智能的语音识别引擎正来源于此。

“语音技术是一个典型的交叉科学,涉及到很多方面,具有一定门槛。”正因如此,创业初期,智能的团队遭遇了许多的怀疑目光,不少投资人认为这个项目不适合创业型公司来做。

总结:

目前最难实现的就是自然语言处理(NLP),相比较而言语音识别(ASR)相对容易,语音技术主要分为三块:语音识别,自然语言处理(语义理解),语音合成。

语音识别目的:将声音转化成文字的过程,简称STT;语音合成目的:将文本合称为声音的过程,简称TTS;自然语言处理,就是语义解析的过程,简称NLP。

自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,为实现人机间自然语言通信。

年春季,科大讯飞发布会在北京国家会议中心召开,李开复曾在微博上对市面上存在的众多“中国Siri”提出四点疑问:

1)智能手机主界面是手触,语音助手解决了什么真正用户需求和痛处?

2)如何克服后台海量数据学习技术门槛?全球只有一个公司有这个技术。

3)应用谁开发?自己开难扩张,用别人的应用整合不佳影响体验。

4)语音服务器和带宽成本较大,如何克服?

⊙以上内容版权归属「iNews新知科技」所有,如需转载,请务必注明。

转载请注明:http://www.0431gb208.com/sjszlfa/3507.html