Skip to content

加入Tesseract OCR与自动朗读功能的团子翻译器,可以识别并翻译小语种

License

Notifications You must be signed in to change notification settings

NewComer00/Dango-Translator-tesseract

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

团子翻译器 Tesseract OCR

基于2022年7月29日PantsuDango/Dango-Translator主线分支的魔改版本,为团子翻译器添加了以下功能:

  • 使用离线OCR引擎Tesseract进行文本识别
  • 自动朗读当前OCR的文本识别结果

Tesseract是一款历史悠久的强大离线OCR引擎,可以识别超过100种的语言。现在用户可以使用团子翻译器中的Tesseract OCR来识别并翻译小语种了。

示例图片

assets/tesseract_ui.jpg assets/reader_ui.jpg assets/tesseract_demo_rus1.jpg assets/tesseract_demo_rus2.jpg

运行环境

  • Windows
  • Python3

附:本人开发时的环境

  • Windows 10 21H2 19044 x64
  • Python3.9.1 x64

安装方法

  1. 加速安装Python包
    整个安装过程需要下载很多Python包。若在执行pip install 包名称时下载进度缓慢,可以使用国内的PyPi加速镜像。使用中科大镜像源加速的格式如下:
pip install 包名称 -i https://mirrors.ustc.edu.cn/pypi/web/simple
  1. 打开PowerShell,创建一个Python虚拟环境
    我们即将安装一系列的Python包,为了让这些包和外界环境隔离,建议使用虚拟环境。如下命令执行完毕后,会在Windows的C:\Users\用户名\目录下创建一个app_env文件夹,里面存放着一个独立的Python虚拟环境。
pip install virtualenv
virtualenv $HOME/app_env
cd ~/app_env
  1. 激活虚拟环境
    激活成功后命令行会出现(app_env)字样。接下来Python包都会被装进该环境,与外部环境隔离。
./Scripts/activate
  1. 克隆或下载该项目
    把本项目的代码克隆或下载到当前虚拟环境目录;进入项目目录。
git clone --depth 1 https://github.com/NewComer00/Dango-Translator-tesseract
cd Dango-Translator-tesseract
  1. 安装Python依赖包
    如果下载缓慢,记得按照第0步提示加速哟,在下述命令结尾加上-i 镜像源链接即可。
pip install -r ./requirements.txt
  1. 运行程序
    程序内有比较完整的新功能教程,如果出现问题欢迎提出Issue。
python ./app.py
  1. 退出虚拟环境
    如需退出虚拟环境,直接在命令行输入deactivate即可。关闭PowerShell时也会自动退出虚拟环境。

再次运行

首次安装完成后,如需再次运行,请打开PowerShell输入以下命令:

cd ~/app_env; ./Scripts/activate; cd ./Dango-Translator-tesseract; python ./app.py

About

加入Tesseract OCR与自动朗读功能的团子翻译器,可以识别并翻译小语种

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%