Board logo

标题: [文本处理] 求助:批处理获取网页中固定内容 [打印本页]

作者: hijackle    时间: 2013-9-1 04:24     标题: 求助:批处理获取网页中固定内容

一个网页中含有多个重复的以下的TR,如果获取网页中如以下代码
  1. <TR bgColor="#FFFFCC" onmouseover=javascript:this.bgColor='#ffffff' onmouseout=javascript:this.bgColor='#FFFFCC'><TD width=120><a
  2. href=http://www.111.com target='_blank'>信息01</a></TD><TD width=101><a href=http://www.111.com target='_blank'>信息02</a></TD><TD width=150><span
  3. class=STYLE4>信息03</span></TD><TD align=center width=80>信息04</TD><TD>信息05<font color=#0000ff>信息06</font></TD><TD width=120>信息07</TD><TD
  4. align=center width=56><a href=http://www.111.com target='_blank'>信息08</a></TD></TR>
  5. <TR bgColor="#FFFFCC" onmouseover=javascript:this.bgColor='#ffffff' onmouseout=javascript:this.bgColor='#FFFFCC'><TD width=120><a
  6. href=http://www.222.com target='_blank'>信息21</a></TD><TD width=101><a href=http://www.222.com target='_blank'>信息22</a></TD><TD width=150><span
  7. class=STYLE4>信息23</span></TD><TD align=center width=80>信息24</TD><TD>信息25<font color=#0000ff>信息26</font></TD><TD width=120>信息27</TD><TD
  8. align=center width=56><a href=http://www.222.com target='_blank'>信息28</a></TD></TR>
复制代码
如何无视网页内的其他内容,只获取每个TR里面的
www.111.com 信息01 信息02 信息03 信息04 信息05 信息06 信息07 信息08
www.222.com 信息21 信息22 信息23 信息24 信息25 信息26 信息27 信息28
..........
输出到新的文本里面去?




欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2