所谓“删除非段落换行”,从PDF文档中复制来的文字每一行都是一个独立的段落,会把原本处于同一段落的n行文本变成n个段落。希望能加入“删除非段落换行”功能,讲这些不正确的换行去掉。比如可以将每段是否以。?!“等表示结束的标点符号为结尾作为判断依据,若否,则为非段落换行,需要去除该处的换行符。
这个便是
这个便是