列表操作,去除不符合正则的内容,去除失败

使用问题 · 1367 次浏览
墨尹琳 创建于 2天23小时前

步骤:

1. 由OCR或文本选中获取text处理成列表,然后对列表的每一项进行文本处理去掉零宽字符、去除前后空白内容后经由正则替换输出为列表。
2. 通过列表操作,移除不符合正则的内容,正则为\s+   理论上每个项都没有空白字符,应该都会被移除吧
3. 结果 由OCR取得的文本,全部被移除,由获取文本取得的文本,没有被移除

我的问题:
对同一内容一个OCR,一个获取,得到的文本内容只是前者没有换行符,后者有换行符的区别,但是我全部都经过文本处理去除了零宽字符和换行符,理论上两个文本是完全一样的,但结果却是初始文本有换行符,然后经过文本处理去除掉空白字符仍没有被去除掉,而我在调试记录中完全看不出两者有什么区别,说明一下,以下截图是选取的两次不同文本,但实际上对同一文本分别OCR和获取也是一样的结果

其实我是想用\S+去除掉空行的,但是没注意写成了\s+,但是他却没有把不包括空白字符的项目给移除,导致我直到增加了OCR功能输出空白才发现,除了零宽字符它难道还有什么不可见的符号吗

测试文本文档

动作

墨尹琳 最后更新于 2025/6/9

回复内容
沉没的白鲸 2天21小时前
#1

至少表面看起来是正常结果。你先弄明白要干什么再填正确的“验证”或者“包含”正则表达式,如果要求助 

- 如果是动作问题,请发动作网址

- 调试运行并提供调试文件网址 (参考

https://getquicker.net/KC/Kb/Article/1044


墨尹琳 回复 沉没的白鲸 2天20小时前 :

其实我觉得有截图所示的调试部分就已经够了,问题就是相同的文本与步骤下列表操作得到的结果不同
至于我填写错误正则其实与本问题无关,而是因为这个问题导致我没有发现填写错了正则
动作

调试运行1

调试运行2

CL 回复 墨尹琳 2天20小时前 :

有点复杂,脑力不够,分析不下去😂。

如果认为存在bug,请做一个最简单动作复现问题发一下我这里分析看看。

沉没的白鲸 回复 墨尹琳 2天19小时前 :



墨尹琳 回复 沉没的白鲸 2天19小时前 :

谢谢大佬排查,原来是文本处理去除前后空白空格不会去除

墨尹琳 回复 CL 2天18小时前 :

我已经更新了简化动作,不过白鲸大佬已经发现原因了,去除前后空白原来不包括空格🤣
希望帮助说明能在详细些,去除空白不包括空格、零宽字符。其实对于我这种不懂电脑的来说挺反直觉的,另外顺便问一句,上次那个发送文本到窗口就桌边卡死的有办法吗
去除前后空白字符

去除文本串两端的不可见字符;

CL 回复 墨尹琳 2天11小时前 :

去除前后空白肯定是会去除空格的。

墨尹琳 回复 CL 2天7小时前 :
抱歉,我给意识混乱了,把去除空白放在了替换之前却没发现,昨天还确定了好几次😑
不过还是希望该项说明能附一下不包括零宽字符
CL 回复 墨尹琳 2天7小时前 :

好的。

回复主贴