段落排版 公开

小铅笔 更新于 2020-04-13 11:15 | 12 | (0) | 323
分类
点赞
更多信息
分享人 小铅笔
分享时间 2020-02-09 17:13
最后更新 2020-04-13 11:15
修订版本 1
Quicker版本 1.5.16.0

介绍

根据文本标点符号进行自动分段。适用于处理从pdf中复制的带有段落的文字。

默认只需设置【输入文本】以及【输出文本】即可。

其他输入选项
1. 句末标点正则:句末断句标点符号的正则表达式。比如在一行文字的末尾遇到句号。感叹号!等,则使用分段。
2. 句始符号正则:句子开头标点符号的正则表达式。比如在pdf中,常用“· ”或者“- ”表示一个项目符号,以及章节的标题 “1.1.2 ” 的形式。在一行文字开头遇到这些符号,则使用分段。
3. 句末缩写正则:排除【句末标点正则】的一些特殊情况,如果在句末遇到英文句号【.】,但实际情况是缩写【Fig.】,这时就不会使用分段。这种缩写常见于英文文献。

备注:该子程序分段思路参考了【天若幽心】的动作【段落排版】。



子程序的参数

输入
输入文本 选中文本 Text
句末标点正则 句末标点 Text
句始符号正则 项目符 Text
句末缩写正则 缩写符 Text
输出
输出文本 每次循环结果 Text