Board logo

标题: [文本处理] 批处理删除乱码 [打印本页]

作者: honghong33    时间: 2015-3-26 23:48     标题: 批处理删除乱码

删除txt中的乱码,以行为单位
1、如果有一行中不含汉字则删除此行。
2、有汉字和乱码组成的段落中,对段落末端的乱码:在?!。,""……之后不存在汉字的则删除。

以振兴汉室为目标。4 ~  c* H5 u7 R$ z( _: Q0 r
。之后午汉字删除4 ~  c* H5 u7 R$ z( _: Q0 r
保留 以振兴汉室为目标。

周瑜!2 k9 s1 W$ W' h8 t7 d' v
!之后无汉字删除2 k9 s1 W$ W' h8 t7 d' v
保留 周瑜!

不存在?!。,""……则以汉字开始删除
曹操7 F' j4 X6 `$ U, K1 l4 R3 ]
删除7 F' j4 X6 `$ U, K1 l4 R3 ]
保留 曹操

删除在段落开头的乱码,直至出现汉字、”+汉字、(+汉字、纯数字+汉字、纯字母+汉字
如# A# |8 A  M4 `# D  ?0 k! W赤壁之战
删除# A# |8 A  M4 `# D  ?0 k! W
保留 赤壁之战

u) a( W2 q/ t3 J7 E& d* |曹操
删除u) a( W2 q/ t3 J7 E& d* |
保留 曹操


_/ J7 v8 b7 n“碰”
删除 _/ J7 v8 b7 n
保留“碰”

xx中学
不删除

2012年
不删除

[attach]8459[/attach]




欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2