这种情况下,如何利用找图找字功能获取目标截图区域?

使用问题 · 417 次浏览
craming 创建于 2023-06-18 12:07

如下图:目的是要在pdf文档里找到“大额分期手续费”的具体金额。

 

 

目前的思路遇到的障碍在于:

1、如果通过找图去找“大额分期手续费”。由于pdf里的字体和文字大小不是稳定的,容易失效。

2、如果通过找字,找到‘大额分期手续费’这几个字后,我不知道该如何利用它去确定金额所在位置的截图区域。(比如 ,找到的‘大额分期手续费’几个字的坐标是X1,Y1。此时,考虑到pdf的扫描件里的字体时大时小,我不知道该如何获取金额所谓区域的Left,top,right,botton的值)(还要考虑的是,‘年费’二字与对应金额的距离是大于‘大额分期手续费’与对应金额的距离的,每个费用的名目与它的金额之间的间距都是不同的)

3、暂时不考虑全屏ocr后通过文本的处理取值。因为实际运行的时候,pdf里有水印,影响全屏ocr。

 


回复内容
臭冬瓜 2023-06-18 12:53
#1

这个修改本身就应该基于原始数据文件,可能是EXCEL、WORD或者其他格式,现在非用OCR方式,不但准确率和难度、复杂程度都翻番,而且此举有篡改数字之嫌

臭冬瓜 最后更新于 2023-06-18 12:54
craming 回复 臭冬瓜 2023-06-18 13:25 :

原始是从一个系统里导出的。由于数据敏感,我要用的时间只能看pdf。

我的诉求,只需要读取,不需要修改这个pdf。


臭冬瓜 回复 craming 2023-06-18 13:40 :

PDF本身是图片还是文字?

如果是文字,可以模拟CTRL+A,CTRL+C,复制并规范文字后,直接进行查找,这样更加准确。

如果PDF本身是图片,你使用找字的方式和用OCR后再找字都是一样的,因为找字也是基于OCR识别后再定位。所以对于表格,都是考验准确率。

PS:最好还是试一试通过找图获得定位,如果可以这个方式应该比你用OCR要强一些。

臭冬瓜 最后更新于 2023-06-18 13:46
craming 回复 臭冬瓜 2023-06-18 18:07 :

有的是文字,有的是图片。

我再试试,谢谢

回复主贴