毕业论文
您现在的位置: 语言识别 >> 语言识别资源 >> 正文 >> 正文

Python神工具包翻译文字识别

来源:语言识别 时间:2022/7/12
白癜风医院南宁哪家好 http://pf.39.net/bdfyy/bdflx/140801/4438675.html

今天给大家介绍一款Python制作的实用工具包,包含多种功能:

音频转文字

文字转语音

截图OCR文字识别

复制翻译

举个例子,比如截图OCR文字识别就有很多实用场景。

常会遇到有些PDF是扫描版的无法复制(豆丁网上的),有些网页(极客时间)也限制了复制功能。这时候要复制,通常情况下只能手动去打,很浪费时间对吧。当然也可以使用一些OCR识别软件,但要么付费要体积很大,不方便。

用这款工具就很容易解决,只要打开软件,点击截图就会自动识别,自动在对话框里输出识别后的文字,然后直接复制就行了,非常方便:

实操效果:

再比如中英文翻译也是经常会用到的,通常情况的操作是打开百度翻译网页然后复制进去翻译,也不方便。

使用这款工具很轻松就能处理,翻译效果还不错:

动图效果:

语音识别也很常用了,比如一些看了一些网课视频想做笔记,不想去手打的话。可以先把视频中的语音抽出来,然后使用该工具直接转换成文字。

这些功能是Python实现的,很强大对吧。做起来也不难,两步就能实现。

第一步获取API接口。这些功能都是调用百度AI的各种功能API接口获得的,免费使用次数足够多。

第二步,使用python的pyqt5GUI框架制作出可视化界面,pyqt5需要稍微学下,但也不难,有具体的需求了学起来也更有针对性。

下面简单说下如何获取API接口。

以语音识别接口为例,进入百度语音识别网站:

转载请注明:http://www.0431gb208.com/sjslczl/781.html