如下图:目的是要在pdf文档里找到“大额分期手续费”的具体金额。
目前的思路遇到的障碍在于:
1、如果通过找图去找“大额分期手续费”。由于pdf里的字体和文字大小不是稳定的,容易失效。
2、如果通过找字,找到‘大额分期手续费’这几个字后,我不知道该如何利用它去确定金额所在位置的截图区域。(比如 ,找到的‘大额分期手续费’几个字的坐标是X1,Y1。此时,考虑到pdf的扫描件里的字体时大时小,我不知道该如何获取金额所谓区域的Left,top,right,botton的值)(还要考虑的是,‘年费’二字与对应金额的距离是大于‘大额分期手续费’与对应金额的距离的,每个费用的名目与它的金额之间的间距都是不同的)
3、暂时不考虑全屏ocr后通过文本的处理取值。因为实际运行的时候,pdf里有水印,影响全屏ocr。