【已解决】批处理如何批量下载网页链接中的pdf文件？ - BAT求助&讨论 - 批处理之家 BAT,CMD,批处理,PowerShell,VBS,DOS

返回列表发帖

ivor

上校

Rank: 6 Rank: 6

帖子: 979
积分: 3381
技术: 172
捐助: 40
注册时间: 2012-1-7

7楼 跳转到 »

发表于 2016-3-22 10:52 | 只看该作者

回复 6# codegay

好

#&cls&@powershell "Invoke-Expression ([Io.File]::ReadAllText('%~0',[Text.Encoding]::UTF8))" &pause&exit

TOP

codegay

少校

Rank: 6 Rank: 6

帖子: 1266
积分: 1775
技术: 162
捐助: 0
注册时间: 2015-12-12

6楼

发表于 2016-3-22 10:37 | 只看该作者

回复 5# ivor

说明要加python3.

去学去写去用才有进步。安装python3代码存为xx.py 双击运行或右键用IDLE打开按F5运行

TOP

ivor

上校

Rank: 6 Rank: 6

帖子: 979
积分: 3381
技术: 172
捐助: 40
注册时间: 2012-1-7

5楼

发表于 2016-3-22 10:26 | 只看该作者

本帖最后由 ivor 于 2017-11-24 21:40 编辑

回复 1# wzf1024

Python3.5
下载地址保存为list.txt，复制到迅雷批量下载

# coding:utf-8
import bs4
import urllib.request as url


web_site = 'http://pmmp.cnki.net/OperatingDiscipline/Details.aspx?id=%s'
with open('list.txt','w') as wfile:
    for num in range(10001,16715):
        try:
            req = url.urlopen(web_site % str(num)[1:])
            soup = bs4.BeautifulSoup(req,'html.parser')
            for i in soup.find_all('a'):
                if i.string == '全文下载':
                    downloadUrl = url.unquote(i.get('href'))
                    print(downloadUrl, file=wfile, flush=True)
                    print(downloadUrl)
                    break      
        except:
            print("服务器错误！请检查网址连接    当前id=%s" % str(num)[1:])
            pass
input("回车结束")
复制代码

#&cls&@powershell "Invoke-Expression ([Io.File]::ReadAllText('%~0',[Text.Encoding]::UTF8))" &pause&exit

TOP

wzf1024

一级士官

Rank: 2

帖子: 77
积分: 104
技术: 0
捐助: 0
注册时间: 2015-11-18

4楼

发表于 2016-3-22 10:14 | 只看该作者

CrLf 的混编代码怎么用啊，哪位大侠告知，
为什么我保存bat运行后，什么都没得到就“请按任意键继续”，按键就退出了？我是xp系统

TOP

wzf1024

一级士官

Rank: 2

帖子: 77
积分: 104
技术: 0
捐助: 0
注册时间: 2015-11-18

3楼

发表于 2016-3-22 01:24 | 只看该作者

回复 2# CrLf

老大，这个怎么用啊，菜鸟不懂啊，运行bat没结果，求你了，指点指点啊

TOP

CrLf

论坛巡查

Rank: 8 Rank: 8

帖子: 6388
积分: 18843
技术: 982
捐助: 100
注册时间: 2010-10-9

2楼

发表于 2016-3-21 23:58 | 只看该作者

@echo off
more +4 %0 | mshta http://bathome.net/s/hta/ eval(WSH.StdIn.ReadAll())
pause & exit /b

for(var i=10001;i<12150;i++){
	var url='http://pmmp.cnki.net/OperatingDiscipline/Details.aspx?id='+(''+i).substr(1)
	var html=web(url)
	var match=html.match(/([^\u0022]+?)\u0022>全文下载/)
	if(!match)break
	download(decodeURI(match[1]))
}
复制代码

2 评分人数

bailong360: 还能这样混编技术 + 1
codegay: 1技术 + 1

链接：在线第三方命令行工具下载 bat、vbs、js 原生混编

TOP

返回列表

[新手上路]批处理新手入门导读	[视频教程]批处理基础视频教程	[视频教程]VBS基础视频教程	[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动	[批处理精品]CMD命令50条不能说的秘密	[在线下载]第三方命令行工具	[在线帮助]VBScript / JScript 在线参考

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]