这两年AI最火的非智能音箱莫属,为抢占入口,市场上语音产品层出不穷,现已是一片红海,智能音箱已经成大厂们的标配产品或是战略中的一部分。那问题来了,没有大厂技术基因,没有NLP(NaturalLanguageProcessing)技术背景的小公司,应该怎么做“AI”智能语音产品呢?
一、选择第三方NLP开放平台
NLP技术沉淀周期过长,投入会很大,选择第三方开放平台想必是小公司最好的选择,推荐三个AI语音开放平台:
科大讯飞开放平台;百度AI开放平;搜狗云知音。
二、明确技术分工
上图是引入单个NLP的对接方案,通过任务分解,可以很清楚知道,哪些是第三方平台做的,哪些是我们要做的。
NLP底层识别交给第三方开放平台:
ASR(AutomaticSpeechRecognition,自动语音识别):作用是将语音输入转化为文本文字NLU后台(NaturalLanguageUnderstanding,自然语言理解):开放给使用者的一套自定义语义系统TTS(TextToSpeech,文本转语音):用于文本转语音唤醒模型:预置唤醒词,当用户发出该语音指令时,设备便从休眠状态中被唤醒,并作出指定响应,唤醒词需要反复训练提升唤醒率,降低误唤醒。OS(OperatingSystem):OS在执行层面发挥的巨大作用,比如:正在执行播放音乐,你想关闭、切换歌曲,这时候OS就显示出他的作用了系统垂类:开放平台所带的系统技能NLU补充、执行干预、运营系统是我们需要做的。
三、谈谈我们要做的内容
底层工作交给开放平台之后,我们需要搭建自己的运营管理系统,开发自己想要的技能。
技能
相当于垂类,简单的说就是某个应用程序,语音作为入口打开应用,像音乐、新闻、天气、笑话等都属于技能,比如:讲个笑话,语音产品执行打开了“笑话”应用,给你返回一条笑话内容。
技能决定了产品内容的广度,技能可以是自制,比如:闹钟,也可以从第三方合作引进,像“抖音”、“
转载请注明:http://www.0431gb208.com/sjslczl/4793.html