Board logo

标题: [文本处理] [已解决]批处理如何批量提取TXT中的网址? [打印本页]

作者: clemente123    时间: 2011-10-12 21:23     标题: [已解决]批处理如何批量提取TXT中的网址?

我的TXT内容如下:

                <td><b><a href="http://oekoportal.de/portal/members/9269?keywords=nahrungsergaenzung+nahrungsergaenzungsmittel+vitalstoffe+mikronaehrstoffe+mineralstoffe">www.helfenberg-shop.de</a></b></td>
                <td>HELFENBERG HealthStyle GmbH</td>
                <td><b>DE</b></td>
                <td><b>01326</b></td>
                <td>Dresden</td></tr><tr class="phymatch1-even">
                <td><b><a href="http://oekoportal.de/portal/members/6038?keywords=pferdewasser+original+tiroler+naturprdukte">biorello</a></b></td>
                <td>Natur Pur Shop</td>
                <td><b>DE</b></td>
                <td><b>01445</b></td>
                <td>Radebeul</td></tr><tr class="phymatch1-odd">

如何只提取其中的网址,即""里的http网址,希望各位高手帮帮忙
作者: awk    时间: 2011-10-12 21:29

  1. sed -r "/http:/!d; s/.*\"(.*)\".*/\1/" a.txt
复制代码

作者: hfg1977    时间: 2011-10-12 21:41

  1. sed -n "s/.*\(http:\/\/[^>\"]*\).*/\1\n/p" 01.txt
复制代码

作者: clemente123    时间: 2011-10-12 21:44

回复 2# awk


    请问下把代码保存在新TXT里,然后改成.BAT格式吗?
作者: clemente123    时间: 2011-10-12 21:45

回复 3# hfg1977


    请问下把代码保存在新TXT里,然后改成.BAT格式吗?
作者: weichenxiehou    时间: 2011-10-12 21:53

回复 5# clemente123
他们运用了一个三方工具sed.exe,因此并不是纯批,除了要保存代码在bat文件里外,还需要下载sed.exe放到工作目录或PATH目录里。
作者: clemente123    时间: 2011-10-12 21:55

回复 6# weichenxiehou


    谢谢你的回答,可以还不懂,能否加QQ673693502详细聊下?
作者: weichenxiehou    时间: 2011-10-12 22:07

  1. @echo off
  2. (for /f tokens^=2delims^=^" %%i in ('findstr "href=" a.txt') do echo,%%i)>new.txt
  3. start new.txt
复制代码

作者: clemente123    时间: 2011-10-12 22:17

回复 8# weichenxiehou


    谢谢,太厉害了!
作者: clemente123    时间: 2011-10-12 22:18

我是新手,2楼3楼我不会用,8楼的哥们太厉害了!
作者: zaixinxiangnian    时间: 2011-10-12 23:07

@echo off
for /f tokens^=2^ delims^=^"? %%i in ('findstr /i "http" a.txt') do echo %%i?>>2.txt
pause




欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2