我们经常在一些科幻电影中看到,电影演员挥一挥手就可以操控影视中的物体,十分炫酷。那么这种场景是如何实现的呢?今天我们就来一起了解一下高精度、高稳定性的手势识别是如何完成的,手势识别采用了哪些技术。
什么是手势识别?
手势识别是跟踪人类手势、识别其表示和转换为语义上有意义的命令的整个过程。以视觉手势识别为例,视觉手势识别的原理很简单,主要就是通过摄像头捕捉信号,通过软件算法计算出手的位置信息,判断手势姿态,将其处理成可理解的信息。
众所周知,手势和肢体来表达意思是人类最早的方式,比语言还要早,这是人类最早的沟通方式,用来进行互相沟通和交流。手势是无声的语言。人们在生活中借用手势,来表达各种各样的感情。现在,人还可以与计算机之间进行手势互动。机器视觉和人工智能高速发展的今天,手势与键盘、交互屏幕等进行了深度的融合,应用到了诸多场景。
手势识别主要分为两类?
从手势交互信息采集的途径来看,可以分为接触式和非接触式两种。
接触式手势识别主要是通过使用众多传感器进行手部动作姿态的定位,常见的就是数据手套、加速度计、多点触摸屏等。这种识别方式一般来说准确率较高,特别是数据手套的静态识别,准确率可以达到99%左右。
非接触式手势识别主要是使用光学传感器、雷达探测等实现。随着科技的不断发展和算法的不断进步,视觉手势识别作为非接触式手势识别脱颖而出。
视觉手势识别解决了接触式手势识别需要接触手部骨骼,对应于场景有极大限制的难题,因为接触式手势识别在识别过程中要求用黑色或白色的墙壁做背景,尽可能简化背景。要求人手戴上特殊的手套来强调手部也可,总之在环境上要突出显示手部。
视觉手势识别的优势在于利用摄像头拍摄手部的动作,通过软件软法对图像序列进行处理,进而分割出手势区域获取手势的三维动作信息,将其与系统中设定好的手势信息进行比对,达到手势识别的目的。系统设定的手势信息一般是通过采集各种手势不同位置、不同比例的手型图像,作为手势匹配的模板,建立一个庞大的数据库。视觉手势识别不仅是基于深度的3D手势识别,而且识别率较高,甚至对于微小的手势动作也可以捕捉到。
视觉手势识别的基础首先要进行手部的近30个关键点的检测,除此之外,这30个关键词的组合有无数种,同时传感器无法感知被隐藏的手指位置信息在通过软件算法的推算后也能得出准确的位置信息。
目前,由于语言作为沟通交互的主要方式,语音识别已经成功地应用于诸多领域,可以与之,语音识别的成功,手势识别的大面积广泛应用也不会遥远,我们拭目以待。
转载请注明:http://www.0431gb208.com/sjsbszl/2941.html