- 帖子
- 7
- 积分
- 21
- 技术
- 0
- 捐助
- 0
- 注册时间
- 2020-5-26
|
[文本处理] 如何用BAT批处理文件对比剔除2个TXT文件带有特定重复行内容的行?
现在有A.txt和B.txt ,这2个TXT文件,
A.txt为主文件,(比如大小为1M,内有1万行IP地址信息,不带端口号),文本内容每行例如 110.39.175.2
B.txt为需要进行筛选的文本(内有3000行新的IP地址信息,带有端口号), 文本内容每行例如 110.39.175.2:5566
现在需要一个BAT文件,比对A,B 这2个txt文件,对B文件进行筛选,去掉所有和A有重复的行,输出C.txt
注意:A,B 内容每行都是IP地址,B不同的是带有端口号,在筛选的时候需要忽略B文件的 : 和 端口号 后 在生成 C文本
范例
====文本A内容(IP地址),作为参考母版====比如有12行=======
110.39.175.2
113.53.53.138
155.138.133.21
103.89.24.4
176.110.154.59
136.244.101.170
103.28.121.58
106.54.219.223
141.164.58.56
150.138.106.80
155.138.131.165
139.99.91.22
====文本B内容(IP地址+端口,: 是IP和端口的分割符), 作为需要筛选的对象=====有5行,忽略:和端口号后,其中3行和A有重复=======
110.39.175.2:5566
113.53.53.138:8080
155.138.133.21:80
113.53.53.138:1080
152.138.183.25:8888
====输出文本C,在B剔除和文本A字段重复后的结果=============
113.53.53.138:1080
152.138.183.25:8888 |
|