毕业论文
您现在的位置: 语言识别 >> 语言识别优势 >> 正文 >> 正文

免费自动AI语音识别制作字幕,从此解放时

来源:语言识别 时间:2022/10/22

免费自动语音识别和字幕制作

大家好我是啊忠略懂点,欢迎来到我的宝藏频道,我主要分享各种省钱避坑,跨境技术和自媒体转化工具的知识内容,如果感兴趣的欢迎订阅我的频道,看看不一样的赛道。

AI语音识别是很大的应用场景,而针对我们个人的立场出发,又有自媒体从业者,相关论文科研报表,电子商务语音协助,开发翻译产品,语音控制应用,语音输入方向的应用衍生,如果您对这方面感兴趣或者是其中的从业者,建议看完这次的内容,可以一劳永逸的免费解决问题。

软件名称:VideoSrt语雀0.3.3免费语音识别+字幕制作

是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。

适用于快速、批量地为媒体(视频/音频)生成中/英文字幕、文本文件的业务场景。

打开阿里云

我们一共需要开通设置三个服务,分别是“访问控制”、“对象存储OSS”、“智能语音交互”。

请开通设置前,先自行注册阿里云账号,并完成账号的(个人/企业)实名认证。

----------------------------------------

那么首先开通并设置“访问控制”。

大体流程是“创建用户”→“设置用户权限”→记录”用户ID“+”Secret密钥“。

按照以下的辅助箭头信息的流程开通“访问控制”即可。

控制台→左上角三横图标(产品与服务)→访问控制(RAM)

→2-3次的确认立即开通→管理控制台→人员管理-用户

→创建用户(任意自定义名称)-(√)编程访问→开通

并且找到以下信息,把相匹配的信息复制粘贴替换*号并且记录下来,后续要用。

AccessKeyID:

******************

AccessKeySecret:

******************

然后回到用户界面,针对创建好的用户,最右边有“添加权限”

点击“添加权限”→增加“对象存储OSS”、“智能语音交互2.0”这两项服务的权限,

让该服务可以在后续的使用过程中,可以管理控制这两项服务的正常工作。

----------------------------------------

对象存储OSS

该服务,个人用户每天使用2小时语音的情况下免费,超出部分存储费用-数据存储(本地冗余存储)-0.12元/GB/月。

所以软件使用的过程中,会临时的把处理的音频文件上传到这个存储空间,所以就需要看自身使用情况,在该服务的文件管理内,定期的对临时文件进行删除操作,避免出现太多的存储费用。

删除的流程是:对象存储OSS→Bucket列表→Bucket名称

→文件管理→(√)全选→批量操作→进行删除。

按照以下的辅助箭头信息的流程开通“对象存储”即可。

控制台→左上角三横图标(产品与服务)→对象存储OSS

→2-3次的确认立即开通→管理控制台

→创建Bucket(任意自定义名称)、

区域选择就近原则、读写权限设置为“公共读”、其他默认

→选择确定(创建)

之后找到以下信息,把相匹配的信息复制粘贴替换*号并且记录下来,后续要用。

BucketName

******************

↓“外网访问”↓

Endpoint

******************

BucketDomain

******************

------------------------------------

智能语音交互

按照以下的辅助箭头信息的流程开通“智能语音交互”即可。

控制台→左上角三横图标(产品与服务)→智能语音交互

→开通→录音文件识别(试用)-每天两小时免费识别时间

(√)协议→立即开通

按照以下的辅助箭头信息的流程配置“智能语音交互”即可。

管理控制台→全部项目→创建项目→语音识别+语音合成

→任意自定义名称→确定→基于场景选择模型

→非电话-[中文普通话(识音石V1-端到端模型)][识别输入项]

→确认使用→自定义选择语音合成模型[输出项]→确认使用

之后找到以下信息,把相匹配的信息复制粘贴替换*号并且记录下来,后续要用。

Appkey:

******************

------------------------------------

配置video语雀

打开软件界面,按照下面的流程操作,并且把相匹配的信息,复制粘贴进输入框内,并保存。

新建→语音引擎(阿里云)

名称别名:任意自定义名称

设置→OSS对象存储设置

设置→软件设置

文件输出目录:自定义设置文件夹路径

至此,后续就可以打开(拖动)媒体文件,正常自动AI识别字幕啦!

--------------------------------------------

备注:

翻译功能不建议使用,因为涉及翻译过都会有后词不达意的问题,还是有必要先利用翻译系统,逐一校对中文内容的准确性,再合成内容,这样才是错误率最低的方案。毕竟对自己内容负责,是每个自媒体人的基本技能。

好了,以上就是本期的所有内容。

希望我分享的能给大家带来帮助,也别忘记点赞

转载请注明:http://www.0431gb208.com/sjszjzl/2062.html