之前我们提到,发展迅速的人工智能技术发展使得自然语言处理、语音转写、图像识别等技术,如今已经能成熟地应用于大部分数字媒体领域,尤其是内容生产平台的审核工作区域,这次我们就其中的几项主要技术做一个简要的梳理:
1、自然语言处理技术
站在人工智能的角度,所谓的“自然语言理解”指代的是通过:建立一种计算机模型,并给出像人类理解、分析并回答日常使用的各种通俗语言的结果。
简单来说,自然语言处理技术的工作内容是探究如何能让计算机理解、生成我们日常所使用的语言,比如中文、英文等等,使得计算机懂得自然语言的真实意义,并以对话的形式用自然语言回答人类提出的问题。
这种技术所涵盖的研究内容十分广泛,仅从研究成果的表现形式就可以分为三个层面:基础技术层、应用技术层和产品服务层。一般的自然语言处理指的是书面的自然语言理解系统,输入输出都是用书面文字,主要运用基础技术层的技术,运用人工智能芯片、机器学习算法技术,使机器对文字中的负面信息的识别率达到99%以上,在实际应用中,可取代九成人力。
另一方面关于口头的自然语言理解系统,则牵涉到语音识别、语音合成等复杂的技术。
2、语音转写技术
语音转写技术是一种基于深度卷积神经网络的处理技术,可以把一长段的音频数据转换成文本数据,并且运用自然语言输出。目前我国关于语音识别技术的研究已经达到了国际领先水平,特别是中文识别,我国的语音识别系统处于国际一流地位。
语音识别的核心在于语言模型、声学模型以及解码器等。其中,声学模型的突破进步在于深度学习,随着训练模型的数据库规模逐渐增长,深度神经网络的自适应问题、训练效率问题都得到了解决,数字化内容审核过程中将音频的审核文字化,审核效率提高90%以上。
3、图像识别技术
依托海量图片样本进行深度识别训练,基于深度学习技术,可以高效准确地鉴别色情图片、性感图片、涉政图片、恐暴图片等,算法识别准确率达到99.9%以上,远超人工识别水平,实际工作中可以取代90%人力,而且针对图片自动识别领域最难的擦边球界定问题,引擎采用了分离图谱技术,精准识别。
数字媒体内容生产平台包括广告、新闻、电商、直播、社交、游戏、视频、微博、
转载请注明:http://www.0431gb208.com/sjslczl/2007.html