毕业论文
您现在的位置: 语言识别 >> 语言识别发展 >> 正文 >> 正文

终于,有人开发了AI替身,代替自己参加视

来源:语言识别 时间:2023/7/13

疫情让远程办公成为流行,视频会议更成为其中一大典型应用。

但过于频繁的视频会议,让一些人产生了奇怪的想法并将其付诸实践。最近,一位名为马特·里德(MattReed)的工程师,就成功开发出了代替自己参加ZOOM视频会议的AI。

乍看之下好像还挺像这么一回事儿的。

(来源:马特·里德)

而且这个视频会议AI不是只有画面而已,里德还为它设计了简单的语音互动功能,可用以接收你的领导或者同事所说的话,然后还能自动说出你所编写的内容,打造出和谐的会议互动氛围。

那么,这个机器人具体是如何实现的?

为了打造它,里德首先通过Quicktime录制了自己的视频图像,包含几个常用的视频会议表情,例如微笑,摆动头部等。当这些画面循环播放时,仿佛就是一个克隆版的自己。

然后是配置语音功能。基于Artyom.js这一语音识别和文本转语音的开源库,他构建了一个自定义HTMLWeb应用程序,可以实现对麦克风传入的音频进行语音识别和响应提示。

这个库的优点在于,不同于Alexa或Siri必须使用唤醒词才能说话,它只需要听到“Howareyou”“AreyouOK”之类的命令就能触发下一步回应,比如循环表情静止的图像或者说出回复。

你可以将里德该步骤的创作理解为聊天机器人或Alexa语音技能。聊天机器人的原理就是经过编程,可以理解某些输入,并根据这些关键字运行命令以给出一些书面响应。但是由于人类语言的自然可变性,聊天机器人和里德的Zoombot还是蛮容易出错的,毕竟它们都没有学会人类随机应变的技能。

(来源:马特·里德)

最后,里德通过软件ManyCam创建虚拟网络摄像头,再将Zoom摄像头设置为ManyCam虚拟网络摄像头,然后打开扬声器,这个Zoombot就可以开始上班了!

现在,里德已经将他的具体教程发表在了GitHub上,而且广受

转载请注明:http://www.0431gb208.com/sjszyzl/5254.html