OCR 识别工具包:Surya
OCR 识别工具包:Surya
Surya:一个多语言文档OCR工具包,它能够实现准确的逐行文本检测和识别。
逐行文本检测:能够自动识别文档里的每一行文字在哪里。
文本识别功能读取并转换文档上的文字,即把图片上的文字变成可以编辑的文本。(即将推出)
表格和图表检测:识别文档中表格和图表的功能。(即将推出)
支持多种语言:可以处理不同语言的文档,支持英语、中文、日文、印地语等语言
License:
CC BY 4.0