标题: 批处理SEO采集 搜索引擎 结果URL的主要用来采集博客 [打印本页]
作者: msdlya 时间: 2013-8-19 17:36 标题: 批处理SEO采集 搜索引擎 结果URL的主要用来采集博客
原创代码。发不了 。发这里。自己写的SEO采集 搜索引擎 结果URL的代码
(求高手指点)- @echo off
-
- setlocal enabledelayedexpansion
-
- ::关键词
- set GJC=美食
- :: <^&echo.>网址分隔符
- set "Url=新浪:blog.sina.com.cn^&echo.网易:blog.163.com^&echo.搜狐:blog.sohu.com"
- ::采集的网址
-
-
- :::::::::::::::::::::::::::雅虎采集篇:::::::::::::::::::::::::::::::::::::::::::::
-
- ::循环获得 。。网址名称
- FOR /F "tokens=1,2 delims=:" %%i in ('echo %Url%') do (
- set Down=yes
- ::循环判断用开关 Down
- For /l %%a in (1,1,100) do (
- if !Down!==yes (
- echo 雅虎搜索 之 %%i
- echo 第%%a页
-
- echo "http://www.yahoo.cn/s?q=site:%%j%%20%GJC%&page=%%a"
- curl "http://www.yahoo.cn/s?q=site:%%j%%20%GJc%&page=%%a" | geturls.exe | findstr "%%j">>res\yahoo%%i.txt
- IF %ERRORLEVEL%==1 set down=no
- )
- )
- )
-
- :::::::::::::::::::::::::::搜搜采集篇:::::::::::::::::::::::::::::::::::::::::::::
-
- ::循环获得 。。网址名称 soso篇
- FOR /F "tokens=1,2 delims=:" %%i in ('echo %Url%') do (
- set Down=yes
- ::循环判断用开关 Down
- For /l %%a in (1,1,100) do (
- if !Down!==yes (
- echo soso搜索 之 %%i
- echo 第%%a页
-
- echo "http://www.soso.com/q?w=site%%3Ablog.sina.com.cn%%20%GJC%&lr=&sc=web&ch=w.p.b&num=10&gid=&cin=&site=&sf=0&sd=0&nf=&pg=%%a"
- curl "http://www.soso.com/q?w=site:%%j%%20%GJc%&lr=&sc=web&ch=w.p.b&num=10&gid=&cin=&site=&sf=0&sd=0&nf=&pg=%%a" | geturls.exe | findstr "%%j">>res\yahoo%%i.txt
- IF %ERRORLEVEL%==1 set down=no
-
- )
- )
- )
-
- pause
复制代码
作者: 523066680 时间: 2013-8-19 17:42
适当缩进一下
作者: msdlya 时间: 2013-8-19 17:45
回复 2# 523066680
缩进 咋整啊。 不会
作者: gawk 时间: 2013-8-19 21:08
回复 3# msdlya
就是空格,比如:- ::循环获得 。。网址名称
- FOR /F "tokens=1,2 delims=:" %%i in ('echo %Url%') do (
- set Down=yes
- ::循环判断用开关 Down
- For /l %%a in (1,1,100) do (
- if !Down!==yes (
- echo 雅虎搜索 之 %%i
- echo 第%%a页
-
- echo "http://www.yahoo.cn/s?q=site:%%j%%20%GJC%&page=%%a"
- curl "http://www.yahoo.cn/s?q=site:%%j%%20%GJc%&page=%%a" | geturls.exe | findstr "%%j">>res\yahoo%%i.txt
- IF %ERRORLEVEL%==1 set down=no
- )
- )
- )
复制代码
欢迎光临 批处理之家 (http://bbs.bathome.net/) |
Powered by Discuz! 7.2 |