OCR 识别工具包:Surya

Surya:一个多语言文档OCR工具包,它能够实现准确的逐行文本检测和识别。

  • 逐行文本检测:能够自动识别文档里的每一行文字在哪里。

  • 文本识别功能读取并转换文档上的文字,即把图片上的文字变成可以编辑的文本。(即将推出)

  • 表格和图表检测:识别文档中表格和图表的功能。(即将推出)

  • 支持多种语言:可以处理不同语言的文档,支持英语、中文、日文、印地语等语言

GitHub:https://github.com/VikParuchuri/surya

文章作者: waino
本文链接:
版权声明: 本站所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 VLLLO.COM
GitHub GitHub Python
喜欢就支持一下吧