作者be00148 (有新信件还没看)
看板Python
标题[问题] google ocr api的辨识问题
时间Thu Jun 23 14:25:35 2022
一直以来都有使用google cloud vision的api来帮我做图片辨识
但是最近常会发生 段落乱跳的问题
让我无法依据过去经验撷取我要的文字
例如一本书的辨识
过去会一行一行辨识下来
标题
内文
页码
但是现在可能会由左至右 的方式
可能变成
标题
页码 (因为页码在最左边)
内容
不晓得是不是有什麽参数可以去调整?
还是我必须将图片的背景改成单一颜色,让他不会乱区分段落?
感谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 49.216.163.220 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1655965537.A.100.html
1F:推 papple23g: 辨识结果有附文字框座标 可以用 相对位置+正则表达式判 06/24 01:02
2F:→ papple23g: 断 来决定读字的顺序 06/24 01:03