识别内容显示增加排版功能,比如分段等

功能建议 · 177 次浏览
怕死的熊猫 创建于 2024-03-04 09:32

识别内容显示能不能参考截图OCR动作功能,主要是排版功能,比如分段等


回复内容
用户KGvfuMisAgA 2024-03-04 10:24
#1

感谢你的建议。

目前的版本是自带有保留结果段落文本格式的功能的。见下图

开启这个菜单后,基本就可以实现保留格式的效果,唯一的bug在于有些软件可能会把<p></p>这样的标记符识别为文本。


你提到的动作我去看了一下,他的只能段落实现貌似更简单,直接tostring就解决了。但是这种办法之前我测试的时候还是有点小瑕疵的,见下图。因此我没有采用这种办法。


总结:目前动作有保留排版的功能,而且我个人觉得效果应该还比较好(保留了缩进,但是有些软件不支持),如果后续大家都觉得这个效果不大好,我再改进吧。

另外,只有实现了和白描网页版一模一样的排版效果,下载功能才能使用,目前来说,逆向出来白描网页版的排版代码对我而言还是太难了。


祝好

怕死的熊猫 2024-03-04 10:40
#2


的确识别出<p></p>

希望排版出



怕死的熊猫 最后更新于 2024-03-04 10:43
用户KGvfuMisAgA 回复 怕死的熊猫 2024-03-04 10:55 :

你这个看起来是个表格,你用电子表格识别试试看效果

怕死的熊猫 回复 用户KGvfuMisAgA 2024-03-04 16:10 :

网页数据,表格识别没有问题,但自动下载XLS文件再打开没有便捷性,谢谢回复。

用户KGvfuMisAgA 回复 怕死的熊猫 2024-03-04 21:14 :

最新版增加了自动打开excel的功能

怕死的熊猫 回复 用户KGvfuMisAgA 2024-03-05 08:55 :

感谢,辛苦优化

怕死的熊猫 2024-03-04 16:13
#3

我这里保留结果模式识别,<p></p>触发率100%


用户KGvfuMisAgA 2024-03-04 21:16
#4
回复 怕死的熊猫 :

我这里保留结果模式识别,<p></p>触发率100%


其实<p></p>这样的符号只有在显示结果弹窗或者其他小部分软件的输入框里粘贴才会出现

如果你关掉识别结果弹窗(或者压根不开启这个选项),直接去word中粘贴,你会发现,是没有<p></p>这种符号的


另外:21版以上增加了自动打开excel识别结果的设置


已上线仅保留文本功能。在右键菜单设置。效果应该是你要的那种(但表格识别还是得用表格识别才行)

用户KGvfuMisAgA 最后更新于 2024-03-04 23:37
用户KGvfuMisAgA 2024-03-04 23:15
#5

已上线仅保留文本功能。在右键菜单设置

回复主贴