Board logo

标题: [文本处理] 批处理BAT怎样批量删除html里面的一段有规律的代码? [打印本页]

作者: iambater    时间: 2014-3-3 18:57     标题: 批处理BAT怎样批量删除html里面的一段有规律的代码?

html里面有一段代码需要删除处理,原有代码形如:

<a href="../../sgye/xgwz/831.html" tppabs="http://wwwsohu.com/sgye/xgwz/831.html" target="_blank">如何做健身操保养</a>
<a href="../../sgye/xgwz/821.html" tppabs="http://wwwsohu.com/sgye/xgwz/821.html" target="_blank">做怀孕期间可不可以吃辣</a>

需要删除的是

tppabs="http://wwwsohu.com/sgye/xgwz/831.html"
tppabs="http://wwwsohu.com/sgye/xgwz/821.html"

使之变成(注意代码之间的空格)

<a href="../../sgye/xgwz/831.html" target="_blank">如何做健身操保养</a>
<a href="../../sgye/xgwz/821.html" target="_blank">做怀孕期间可不可以吃辣</a>

因为一个文件夹里面html数量众多
本来用的正则表达式,但是总是运行下来不符合要求,因为时间比较急,所以上来求教!
谢谢大家
作者: DAIC    时间: 2014-3-3 20:47

  1. sed -i "s/tppabs=.http:[^ ]\+ //" *.html
复制代码

作者: iambater    时间: 2014-3-3 22:47

回复 2# DAIC


    大校你好测试下来没有删除掉
麻烦再帮忙看下
谢谢
作者: iambater    时间: 2014-3-4 00:11

有人帮忙看下吗
否则明天交不了工啊
作者: DAIC    时间: 2014-3-4 08:13

回复 3# iambater


    把你的html文件打包压缩传上来,我试试。




欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2