作者|韦世玮
**
7月28日下午,人工智能(AI)语音芯片公司「启英泰伦」发布第三代智能语音芯片,包括CIX和CIX两大系列,内置第三代自研技术平台BNPU(脑神经网络处理器),广泛覆盖高性能、低成本端侧语音和端云融合语音等应用。
BNPU作为启英泰伦构建智能语音芯片产品的底层核心,如今已升级到第三代,除了延续其在二代语音识别ASR、声纹识别等方面的技术优势外,还支持单麦深度学习降噪技术、命令词自学习2.0版本。
更重要的是,它实现了两大核心技术突破,一是增加了离线自然语言语义处理,支持离线NLP;二是增加双麦深度人声分离技术,无需记住任何命令词,同时具备识别能力和理解能力,支持用户以自然的方式随心和设备交互。
启英泰伦的产品+技术演进路线
与上一代产品相比,第三代芯片拥有更高算力、高度集成、性能新高三大特点。
算力方面,CIX系列芯片采用BNPU3.0和支持DSP指令扩展的RISCCPU双核架构,主频为MHz,拥有更灵活的计算性能、更强的可编程性,支持高并行向量运算,同时还有KB系统SRAM。集成度方面,该系列芯片集成了双路ADC、两路MIC接口、三路LDO以及常见的MCU通用接口等,可满足各类语音识别应用。性能方面,第三代芯片几乎可以装载所有前端信号处理算法,支持端侧TTS(从文本到语音)。CI6芯片框图及应用
启英泰伦创始人兼CEO何云鹏谈道,语音设备的应用环节和场景十分复杂,不同设备工作的分贝强度也有所差异,既要普遍适应不同环境,也要适应不同用户的个性化表达方式和表达特点。
因此,第三代芯片根据不同应用和客户需求,将CIX和CIX两大系列进行了系列化封装。
在语音处理能力上,CI1、CI2、CI3系列支持离线远场语音识别,准确率超98%,支持更强的噪声适应和口音泛化能力,并支持语音降噪、深度学习降噪、回声消除、本地自学习等算法;CI3和CI6则在声源定位、波束成形、盲源分离等传统算法上增加了端侧NLP;CI5和CI6的语音处理能力分别与CI2、CI6相同,其中CI6支持离线语音+在线语音+AIoT功能。
整体来看,第三代芯片解决方案不管是针对厨房烟机、扫地机器人等70dB以上的高噪环境,还是客厅电视类人声、会场、卖场等多人场景,都能实现良好的识别和适应性。
启英泰伦的第三代智能语音芯片特点
除此之外,启英泰伦为了帮助客户实现敏捷开发,加速产品落地,还推出了新一代语音AI平台,拥有在线开发、在线支持、在线资料、算法API接口四大模块,支持零代码开发、即时生成NLP模型、本地语音合成/开发等功能,并支持个用户同时开发。
启英泰伦语音AI平台框架
从年成立至今,启英泰伦直接或者间接服务的B端客户已超过家,平台开发者超过1万名,在校AI学院超过10万名,离线语音方案的年装机量则超过万,呈快速增长之势。
何云鹏提到,启英泰伦的发展战略分为三个阶段。在第一个阶段,首先解决自然的人机交互,“这是机器人发展的前提条件和基础,语音语言是最自然直接的交互方式。”他说,公司通过第一阶段努力,要让所有设备得到语音交互的升级,在设备终端就进行十分便捷的自然交互,让设备听得清、听得懂。
在第二阶段,则是让所有终端设备高度智能化,更好地为人们提供服务,其主要技术特征在于具备多模态感知交互,以及能够在端侧进行理解和决策,甚至还能自我成长学习。
随着机器人在人们生活中普及,也将进入到更高级的阶段,何云鹏将其称之为“守护精灵”。其技术特点是将智能语音从所有智能设备中抽象出来,成为人们日常生活的全方位管家、百科老师、健康卫士,甚至是知心朋友。“我们的终极目标是打造跨设备、跨时空,打破虚拟世界和现实世界壁垒的产品。”他说。
转载请注明:http://www.0431gb208.com/sjszjzl/7336.html