标题: [文本处理] [已解决]批处理如何批量提取TXT中的网址? [打印本页]
作者: clemente123 时间: 2011-10-12 21:23 标题: [已解决]批处理如何批量提取TXT中的网址?
我的TXT内容如下:
<td><b><a href="http://oekoportal.de/portal/members/9269?keywords=nahrungsergaenzung+nahrungsergaenzungsmittel+vitalstoffe+mikronaehrstoffe+mineralstoffe">www.helfenberg-shop.de</a></b></td>
<td>HELFENBERG HealthStyle GmbH</td>
<td><b>DE</b></td>
<td><b>01326</b></td>
<td>Dresden</td></tr><tr class="phymatch1-even">
<td><b><a href="http://oekoportal.de/portal/members/6038?keywords=pferdewasser+original+tiroler+naturprdukte">biorello</a></b></td>
<td>Natur Pur Shop</td>
<td><b>DE</b></td>
<td><b>01445</b></td>
<td>Radebeul</td></tr><tr class="phymatch1-odd">
如何只提取其中的网址,即""里的http网址,希望各位高手帮帮忙
作者: awk 时间: 2011-10-12 21:29
- sed -r "/http:/!d; s/.*\"(.*)\".*/\1/" a.txt
复制代码
作者: hfg1977 时间: 2011-10-12 21:41
- sed -n "s/.*\(http:\/\/[^>\"]*\).*/\1\n/p" 01.txt
复制代码
作者: clemente123 时间: 2011-10-12 21:44
回复 2# awk
请问下把代码保存在新TXT里,然后改成.BAT格式吗?
作者: clemente123 时间: 2011-10-12 21:45
回复 3# hfg1977
请问下把代码保存在新TXT里,然后改成.BAT格式吗?
作者: weichenxiehou 时间: 2011-10-12 21:53
回复 5# clemente123
他们运用了一个三方工具sed.exe,因此并不是纯批,除了要保存代码在bat文件里外,还需要下载sed.exe放到工作目录或PATH目录里。
作者: clemente123 时间: 2011-10-12 21:55
回复 6# weichenxiehou
谢谢你的回答,可以还不懂,能否加QQ673693502详细聊下?
作者: weichenxiehou 时间: 2011-10-12 22:07
- @echo off
- (for /f tokens^=2delims^=^" %%i in ('findstr "href=" a.txt') do echo,%%i)>new.txt
- start new.txt
复制代码
作者: clemente123 时间: 2011-10-12 22:17
回复 8# weichenxiehou
谢谢,太厉害了!
作者: clemente123 时间: 2011-10-12 22:18
我是新手,2楼3楼我不会用,8楼的哥们太厉害了!
作者: zaixinxiangnian 时间: 2011-10-12 23:07
@echo off
for /f tokens^=2^ delims^=^"? %%i in ('findstr /i "http" a.txt') do echo %%i?>>2.txt
pause
欢迎光临 批处理之家 (http://bbs.bathome.net/) |
Powered by Discuz! 7.2 |