疫情让远程办公成为流行,视频会议更成为其中一大典型应用。
但过于频繁的视频会议,让一些人产生了奇怪的想法并将其付诸实践。最近,一位名为马特·里德(MattReed)的工程师,就成功开发出了代替自己参加ZOOM视频会议的AI。
乍看之下好像还挺像这么一回事儿的。
(来源:马特·里德)
而且这个视频会议AI不是只有画面而已,里德还为它设计了简单的语音互动功能,可用以接收你的领导或者同事所说的话,然后还能自动说出你所编写的内容,打造出和谐的会议互动氛围。
那么,这个机器人具体是如何实现的?
为了打造它,里德首先通过Quicktime录制了自己的视频图像,包含几个常用的视频会议表情,例如微笑,摆动头部等。当这些画面循环播放时,仿佛就是一个克隆版的自己。
然后是配置语音功能。基于Artyom.js这一语音识别和文本转语音的开源库,他构建了一个自定义HTMLWeb应用程序,可以实现对麦克风传入的音频进行语音识别和响应提示。
这个库的优点在于,不同于Alexa或Siri必须使用唤醒词才能说话,它只需要听到“Howareyou”“AreyouOK”之类的命令就能触发下一步回应,比如循环表情静止的图像或者说出回复。
你可以将里德该步骤的创作理解为聊天机器人或Alexa语音技能。聊天机器人的原理就是经过编程,可以理解某些输入,并根据这些关键字运行命令以给出一些书面响应。但是由于人类语言的自然可变性,聊天机器人和里德的Zoombot还是蛮容易出错的,毕竟它们都没有学会人类随机应变的技能。
(来源:马特·里德)
最后,里德通过软件ManyCam创建虚拟网络摄像头,再将Zoom摄像头设置为ManyCam虚拟网络摄像头,然后打开扬声器,这个Zoombot就可以开始上班了!
现在,里德已经将他的具体教程发表在了GitHub上,而且广受
转载请注明:http://www.0431gb208.com/sjszyzl/5254.html