一款繁体中文的ocr工具
项目描述
Simpleocr 库
Simpleocr 是一个基于深度学习方法的繁体中文 OCR python 包。
该库由文本本地化和文本识别组成。
文本本地化
该模型是 tensorflow 对 CRAFT(Character-Region Awareness For Text detection)的重新实现。
文字识别
重新实现是基于 CRNN 模型,将 RNN 层替换为 self-attention 层。
神经网络
自我关注
安装
$ pip install simpleocr
或者
$ git clone https://github.com/xianyuntang/simpleocr
$ cd simpleocr
$ python setup.py install
用法
from simpleocr import ocr
ocr.get_text(['image.jpg'])
去做
- 英语支持
- 显卡支持