没有NLP技术背景,如何造一款AI产品

来源：语言识别时间：2023/5/29

这两年AI最火的非智能音箱莫属，为抢占入口，市场上语音产品层出不穷，现已是一片红海，智能音箱已经成大厂们的标配产品或是战略中的一部分。那问题来了，没有大厂技术基因，没有NLP(NaturalLanguageProcessing)技术背景的小公司，应该怎么做“AI”智能语音产品呢？

一、选择第三方NLP开放平台

NLP技术沉淀周期过长，投入会很大，选择第三方开放平台想必是小公司最好的选择，推荐三个AI语音开放平台：

科大讯飞开放平台；百度AI开放平；搜狗云知音。

二、明确技术分工

上图是引入单个NLP的对接方案，通过任务分解，可以很清楚知道，哪些是第三方平台做的，哪些是我们要做的。

NLP底层识别交给第三方开放平台：

ASR(AutomaticSpeechRecognition,自动语音识别)：作用是将语音输入转化为文本文字NLU后台(NaturalLanguageUnderstanding,自然语言理解)：开放给使用者的一套自定义语义系统TTS(TextToSpeech,文本转语音)：用于文本转语音唤醒模型：预置唤醒词，当用户发出该语音指令时，设备便从休眠状态中被唤醒，并作出指定响应，唤醒词需要反复训练提升唤醒率，降低误唤醒。OS（OperatingSystem）：OS在执行层面发挥的巨大作用，比如：正在执行播放音乐，你想关闭、切换歌曲，这时候OS就显示出他的作用了系统垂类：开放平台所带的系统技能NLU补充、执行干预、运营系统是我们需要做的。

三、谈谈我们要做的内容

底层工作交给开放平台之后，我们需要搭建自己的运营管理系统，开发自己想要的技能。

技能

相当于垂类，简单的说就是某个应用程序，语音作为入口打开应用，像音乐、新闻、天气、笑话等都属于技能，比如：讲个笑话，语音产品执行打开了“笑话”应用，给你返回一条笑话内容。

技能决定了产品内容的广度，技能可以是自制，比如：闹钟，也可以从第三方合作引进，像“抖音”、“

转载请注明：http://www.0431gb208.com/sjslczl/4793.html

上一篇文章：什么是人工智能芯片人们需要知道的一切

下一篇文章：没有了