毕业论文
您现在的位置: 语言识别 >> 语言识别优势 >> 正文 >> 正文

AI技术要素的通俗演义图像与语音识别

来源:语言识别 时间:2023/10/27

我们知道人工智能,又称AI是未来人类信息化融合发展的一个重要方向,关于AI已经多次出现在科幻电影当中,而现实当中,经过近年的发展,AI也开始在不同行业有了不同程度的应用。但作者认为,其发展尚任重道远,我们可以对其抱有梦想,但具体应用距离科幻差得太远,不能干扰了我们对这一进程的判断。对其具体技术要素进行分析,既有助于我们突破AI的限制,也有助于破除AI的迷信,从而,使其得到正确的发展。下面,结合其中的五点要素进行粗浅的解释,以求达上述之目标。

一、图像视觉识别的进展与问题

智能视觉识别是近些年来AI领域的一个重要支撑因素,也是一个重要组成部分。图像识别是指用信息化手段从图像中识别出物体、场景和故事内容的能力。视觉识别技术运用由图像处理、识别、分析等操作及其相关技术所组成的系统,来将图像分析识别任务来分解为便于与图像相符的便于分析和管理的小块任务。比如,就目前的技术来看,一些技术能够从图像中检测到物体的边缘及纹理,结合有关模型与分类技术可被用作确定识别到的特征是否能够代表系统已知的一类物体。

这样的技术目前已经被用于多个领域,比如,智能的质量检测、探伤等原来需要人工处理的工作,可以大大提高人类工作的效率,扩大可以执行工作的时间段与工作空间,从而突破了人类工作的限制,通过AI将相关工作带入一个全新的阶段。我们已经见到有的钢铁企业已经将钢板缺陷采用AI技术进行质量检测,大幅度提升的检测的效率,同时避免人类因生理性疲劳造成的主观失误,可以24小时不中断工作等完全突破我们人类的限制。还有一些高温或者危险环境的检测,可以通过AI技术实现原来人类不能触及的区域。

可以说图像识别有着很广泛的应用,比如:医疗成像分析结合大数据技术等可以被用来提高疾病预测、诊断和治疗,最新的报告,相关技术已经被用于高端机器人手术等;而人脸识别被互联网企业用来自动识别照片里的人物;随着平安城市等技术的发展,配合图像识别技术可以在安防及监控领域被用来指认嫌疑人;而在购物方面,消费者现在可以用智能手机拍摄下产品以了解商品信息并且可以通过比较来获得更多购买选择;而有报道在漫长的工业管道中的管道机器人可以通过图像识别技术来及时对管道故障进行检测,协助进行故障排除。

而机器视觉作为相关学科,泛指在工业自动化领域的视觉应用。在这些应用里,计算机在高度受限的工厂环境里识别诸如生产零件一类的物体,因此相对于寻求在非受限环境里操作的计算机视觉来说目标更为简单。图像视觉识别是一个正在进行中的研究,而机器视觉则是“已经解决的问题”,是系统工程方面的课题而非研究层面的课题。因为应用范围的持续扩大,某些计算机视觉领域的初创公司自在近十年间已经吸引了数亿美元的风投。

目前,从图像识别领域来看,其应用的起点首先来源于图像采集技术,目前的图像采集技术主要包括了摄像头(包括专用摄像头与手机等设备)、扫瞄仪、打印机等影像扫瞄与生成硬件以及相关软件技术,其图像的电子化与标准化仍是未来需要解决的问题,而与之相关的还有识别技术的问题,目前为了达到较高的识别率,多是采用人工辅助配合机器学习与模型生成与学习的技术来进行的,而这一块儿出于成本与技术本身的限制,要达到大规模的发展还需要从技术模式与商业模式等方面进行更长远的发展。最后是应用限制,虽然,我们上述已经提到了系列关于图像识别的应用场景,但从现实当中来看,行业的创新与应用仍然有待于长足发展,无论是出于商业模式的创新,还是出于生存与发展能力的综合权衡,还是出于社会的、人文的等诸多限制因素的考虑,更多的应用落地仍需要一个相对自然的推进进程。

二、语音识别的进展与问题

语音识别领域主要是一系列自动、准确地识别、记录、处理(包括翻译)人类的语音技术。语音识别系统使用一些与自然语言处理系统相同的技术,再辅以其他技术,比如描述声音和其出现在特定序列与语言中概率的声学模型等。语音识别的主要应用包括医疗听写、语音书写、电脑系统声控、电话客服等。比如Domino抯Pizza,最近推出了一个允许用户通过语音下单的移动APP。

以新闻与舆情监测中的语音分析为例。我们每天面临的舆情信息包括来自于平面媒体、传统影视媒体、互联网媒体的,有各类不同互联网舆情,

转载请注明:http://www.0431gb208.com/sjszjzl/6112.html

  • 上一篇文章:
  • 下一篇文章: 没有了