快手研究团队MMU(Multimediaunderstanding)联合清华大学研究人员提出了一种基于音频信号的语种识别新方法。该方法自研一种动态多尺度卷积的新型网络结构,通过动态卷积核、局部多尺度学习和全局多尺度池化技术来捕获全局和局部上下文的语种/方言信息。目前该论文已经被国际顶级语音会议Interspeech所接收。
转载请注明:http://www.0431gb208.com/sjslczl/6936.html