是处理url用的,大概有400万行,原本想用excel筛选功能,手动处理,累一点就累一点吧,结果excel不支持这么多行,我晕。
需要处理的格式如下:- http://www.baidu.com/957
- http://www.baidu.com/4759
- http://www.baidu.com/?page=14
- http://www.baidu.com/archive/123
- http://www.baidu.com/archive/asd
- http://www.baidu.com/category/232
- http://www.baidu.com/category/lalala
- http://www.baidu.com/entry/1223
- http://www.baidu.com/entry/aaa
- http://www.baidu.com/unknow-----------------------(这里的unknown表示无特征英文字母)
- http://www.baidu.com/111%3Fxxx
复制代码 想要用批处理,有3种需求:
需求1:只保留这样的url- http://www.baidu.com/957
- http://www.baidu.com/4759
复制代码 需求2:只保留这样的URL- http://www.baidu.com/archive/123
- http://www.baidu.com/archive/asd
复制代码 需求3:只保留这样的URL- http://www.baidu.com/category/232
- http://www.baidu.com/category/lalala
复制代码 需求2、3估计很好实现,最重要的是需求1。。。
不管结果如何,先谢过所有看过此贴的朋友。 |