征集识别中文标点符号的意见和建议

功能建议 · 377 次浏览
臭冬瓜 创建于 2023-02-09 11:30

下一步准备研究识别中文标点符号,目前已经完成:

1.全角到半角:字母和数字

2.半角到全角:() 转()

3.去除汉字(不包括中文标点符号)之后的全角和半角空格

4.汉字后的标点符号半角转全角:,;:.?!~/\()<> 转,;:。?!~/\()〈〉

5.去除中文标点符号之后的全角和半角空格

6.汉字(不包括中文标点符号)首尾的成对符号:(汉字),〈汉字〉,[汉字],{汉字},“汉字”,‘汉字’

7.公文文号:[][]【】转〔〕

 

还有什么需要识别的,请集思广益

臭冬瓜 最后更新于 2023/2/9

回复内容
暂无回复
回复主贴