用以下代码可以抓取 http://www.iluohe.com/ 上的手机号码数据,分省市按号段顺序加以保存。至于数据的用途,请各位自行发挥。现在上代码:-
- @echo off
- setlocal enabledelayedexpansion
-
- set TT=手机号码整理器1.0
- set www=http://www.iluohe.com
-
- md tmp 2>nul
- md 整理结果 2>nul
- pushd tmp 2>nul||exit
-
- curl -O %www%/all.shtml
- htox32c /ip /O0 /u1+4 all.shtml
-
- :: 以下代码中,findstr "^abc$" test.txt 要写成 findstr "^^abc^$" test.txt 才起作用,原因不明
- for /f "tokens=1-3 delims=<> " %%i in ('findstr /ic:"<city/" all.txt') do (
- if not "%%i"=="*" (
- set province=%%i
- ) else (
- title %TT%-正在处理 !province!-%%j
- md "!province!\%%j" 2>nul
- curl --create-dirs -o !province!\%%j\%%j.html %www%/%%k/
- md ..\整理结果\!province!\%%j 2>nul
- htox32c /ip /O0 !province!\%%j\%%j.html>nul
- (for /f "tokens=1,2" %%i in ('findstr /i "^^1[3,5,8][0-9] 1[3,5,8][0-9][0-9][0-9][0-9][0-9]^$" !province!\%%j\%%j.txt') do (
- if "%%i"=="*" (
- echo %%j
- ) else echo.&echo %%i&echo.
- ))>..\整理结果\!province!\%%j\!province!_%%j.txt
- )
- )
-
- title %TT%-处理完毕
- cls
- echo.&echo.&echo 处理完毕
- popd
- pause
复制代码 需要用到两个第三方命令行程序:curl.exe和HtoX32c.exe,请在论坛里自行搜索。
若不会使用,请直接下载附件中的数据(网站上的数据截止日期为20100126)。
http://pan.baidu.com/share/link?shareid=4196984944&uk=1124163200 |