标题: [文本处理] 批处理如何提取BING.CN里的连接? [打印本页]
作者: zahirll 时间: 2011-3-11 04:31 标题: 批处理如何提取BING.CN里的连接?
批处理打开这个页面然后抓取里面的连接http://cn.bing.com/search?count=1000&q=ip:58.215.64.136
58.215.64.136这个IP是要变的,每次查询都换的,把里面的连接抓出来保存到1.TXT里,然后在执行这段代码
- @echo off
- more +9 "%~f0" >GetUrlText.vbs
- type nul >2.txt
- for /f %%a in (1.txt) do (
- echo 正在检测:%%a
- cscript //nologo GetUrlText.vbs %%a/123.aspx | findstr "<title>无法找到资源。</title>" && >>2.txt echo,%%a
- )
- goto :eof
-
- strURL=WScript.Arguments(0)
- WScript.Echo strURL
- Set objXmlHttp = CreateObject("Microsoft.XMLHTTP")
- objXmlHttp.Open "GET",strURL,0
- objXmlHttp.Send()
- Set objStream = CreateObject("ADODB.Stream")
- objStream.Mode = 3
- objStream.Type = 1
- objStream.Open()
- objStream.Write(objXmlHttp.responsebody)
- objStream.Position = 0
- objStream.Type = 2
- objStream.Charset = "utf-8"
- strText = objStream.Readtext
- WScript.Echo strText
复制代码
[ 本帖最后由 zahirll 于 2011-3-12 18:37 编辑 ]
作者: zahirll 时间: 2011-3-11 14:07
管理。。。。。。。。。。。。。
作者: Batcher 时间: 2011-3-11 20:11
以http://cn.bing.com/search?count=1000&q=ip:58.215.64.136为例,你希望1.txt里面的内容长什么样子?
作者: zahirll 时间: 2011-3-12 18:38
希望格式是
http://123123.com
http://22222.com
http://11111.com
一个地址一行
作者: zahirll 时间: 2011-3-13 11:48
怎么没人帮忙啊。。。。。
作者: Batcher 时间: 2011-3-13 11:54
打开顶楼链接之后显示:
Ref A: CAB6146852B04F69A336665200EBB177 Ref B: 50E51EABBFF8A4225454FE43914B6E40 Ref C: Sat Mar 12 19:53:58 2011 PST
看不到任何链接
作者: zahirll 时间: 2011-3-13 12:02
可以啊,你现在再开看看
作者: Batcher 时间: 2011-3-13 14:19 标题: 回复 7楼 的帖子
打开http://cn.bing.com/之后搜索哪个关键字?我自己试试
作者: zahirll 时间: 2011-3-13 19:55
ip:58.215.64.136 输入这个。但是直接输入没有count=1000这个参数,他每页只显示10条,count=1000是一页显示1000条,这样他能全部显示玩,不然他分几页才能显示完
作者: zahirll 时间: 2011-3-15 00:44
管理大大。。。。。。。
作者: zahirll 时间: 2011-3-15 19:14
顶上~~~~~~~~~
作者: zahirll 时间: 2011-3-17 19:26
唉~~~~~~~~~~~~~~
欢迎光临 批处理之家 (http://bbs.bathome.net/) |
Powered by Discuz! 7.2 |