Board logo

标题: [网络连接] 批处理BAT如何抓取网站的文本? [打印本页]

作者: Tuberose    时间: 2014-3-24 11:37     标题: 批处理BAT如何抓取网站的文本?

我使用:
  1. wget -O Aaa.txt "https://www.theoddsbroker.com/racing.htm"
复制代码
或者
  1. curl.exe -o aaa.txt "https://www.theoddsbroker.com/racing.htm"
复制代码
都不行
484 我的命令写错了,还是什么其他问题。
请这里的 DOS 批帝解惑

谢谢
作者: wjx515    时间: 2014-3-24 15:50

注意你的网址是https加密的 wget加个参数就行了
  1. wget.exe -O Aaa.txt  --no-check-certificate "https://www.theoddsbroker.com/racing.htm"  
复制代码

作者: Tuberose    时间: 2014-3-24 17:07

谢谢楼上的及时回复
但我运行了你的代码
没有生成 Aaa.txt 文件
我加了路径
wget.exe -O C:\Aaa.txt  --no-check-certificate "https://www.theoddsbroker.com/racing.htm"
也没有生成 Aaa.txt 文件
但也没有错误信息出现
不知道什么原因
请再次指教

谢谢

作者: wjx515    时间: 2014-3-25 11:37

回复 3# Tuberose


   我试了下 可以啊 文件打包给你了 http://pan.baidu.com/share/link?shareid=2604401771&uk=402724871
作者: Tuberose    时间: 2014-3-25 14:41

谢谢楼上的 批帝
可能我的 WGet 的版本不对
你的软件可以下载了

但是取得数据不对
只有一些网页 Java 代码
我要的数据没有

比如我在浏览器上打开该网页
另存为 XX 文件
也是没有数据的

484 该网站加密不让人们很容易的获取数据???

再次感谢大神

作者: wjx515    时间: 2014-3-25 16:38

你是要抓取js解析过的内容?如果要抓取js解析过的内容,只能写程序或者用vbs调用IE试试了
作者: wjx515    时间: 2014-3-25 16:39

回复 6# wjx515
另存的话可以用IE另存为txt格式可以保存js解析过的内容
作者: Tuberose    时间: 2014-3-25 18:34

谢谢解答

我需要的是左边和右边的窗口的数据
比如右边的窗口的数据


  ALL 3  TOTES  EXCHANGE
  
  BET  9.50  6.20  12.60      
  BET  6.80  5.80  4.60      
  BET  15.60  15.10  22.80      
  BET  12.60  29.10  8.90      
  BET  4.70  3.70  3.20      
  BET  8.40  8.90  13.40      
  BET  5.60  5.30  7.20      
  BET  3.60  5.80  4.80
作者: Tuberose    时间: 2014-3-25 18:47

是的
另存为txt格式可以保存js解析过的内容
但只是右表第一项的缺省数据

但如何获取所有的数据
比如
点击左边窗口列表的每项
右边的数据就会不同

或者可以指定左边的某项
下载右边的数据

就是说
模拟点击左表的某项
取出右表的数据

再问
另存为txt格式可以保存js解析过的内容
用 WGet 怎么下命令

可能要求高了些

再次谢谢
作者: Tuberose    时间: 2014-3-27 16:57

我用其他软件整出来了
但模拟点击的还不行

还是怀念 DOS
速度快
但 DOS 的命令不熟

谢谢帮助我的各位
作者: Tuberose    时间: 2014-4-17 20:19

这道题是香港赛马场的员工夸口的
不用打开浏览器用代码方式获取数据
难度一:要取全数据
难度二:要秒杀
难度三:可以指定某个赛场并提取右边的数据

后来我在老外的某个网址也发问
没有结果
估计是有一定的难度

以后再说吧




欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2