标题: [文本处理] 批处理BAT怎样批量删除html里面的一段有规律的代码? [打印本页]
作者: iambater 时间: 2014-3-3 18:57 标题: 批处理BAT怎样批量删除html里面的一段有规律的代码?
html里面有一段代码需要删除处理,原有代码形如:
<a href="../../sgye/xgwz/831.html" tppabs="http://wwwsohu.com/sgye/xgwz/831.html" target="_blank">如何做健身操保养</a>
<a href="../../sgye/xgwz/821.html" tppabs="http://wwwsohu.com/sgye/xgwz/821.html" target="_blank">做怀孕期间可不可以吃辣</a>
需要删除的是
tppabs="http://wwwsohu.com/sgye/xgwz/831.html"
tppabs="http://wwwsohu.com/sgye/xgwz/821.html"
使之变成(注意代码之间的空格)
<a href="../../sgye/xgwz/831.html" target="_blank">如何做健身操保养</a>
<a href="../../sgye/xgwz/821.html" target="_blank">做怀孕期间可不可以吃辣</a>
因为一个文件夹里面html数量众多
本来用的正则表达式,但是总是运行下来不符合要求,因为时间比较急,所以上来求教!
谢谢大家
作者: DAIC 时间: 2014-3-3 20:47
- sed -i "s/tppabs=.http:[^ ]\+ //" *.html
复制代码
作者: iambater 时间: 2014-3-3 22:47
回复 2# DAIC
大校你好测试下来没有删除掉
麻烦再帮忙看下
谢谢
作者: iambater 时间: 2014-3-4 00:11
有人帮忙看下吗
否则明天交不了工啊
作者: DAIC 时间: 2014-3-4 08:13
回复 3# iambater
把你的html文件打包压缩传上来,我试试。
欢迎光临 批处理之家 (http://bbs.bathome.net/) |
Powered by Discuz! 7.2 |