标题:
[文本处理]
如何用BAT保存多个相似网页中链接的PDF
[打印本页]
作者:
qxdbat
时间:
2020-11-13 15:47
标题:
如何用BAT保存多个相似网页中链接的PDF
<div class="pdfDLLink"><a href="//jp.c.misumi-ec.com/book/TKA1_01/pdf/0013.pdf" target="_blank">ダウンロード (PDF)</a></div>
上面是其中一个网页的链接代码。
我想用BAT打开这个网页,
然后打开 //jp.c.misumi-ec.com/book/TKA1_01/pdf/0013.pdf 并且保存到本地,
名字为AAA.PDF,
其中不同的网页 TKA1_01/pdf/0013 这部分有变化(这个是主要的)
本人完全小白一个,只会些DOS命令,希望大高手给了BAT的编写代码 谢谢
作者:
Batcher
时间:
2020-11-13 17:27
回复
1#
qxdbat
请给出网页地址。如果已经下载到本地,请选择1个htm文件打包压缩传上来。
作者:
peterboy666
时间:
2020-11-13 17:39
回复
1#
qxdbat
你去下个
WGet
就可以了.
C:\>
WGet --no-check-certificate https://jp.c.misumi-ec.com/book/TKA1_01/pdf/0013.pdf
--2020-11-13 17:36:21-- https://jp.c.misumi-ec.com/book/TKA1_01/pdf/0013.pdf
Resolving jp.c.misumi-ec.com... 13.35.38.99
Connecting to jp.c.misumi-ec.com|13.35.38.99|:443... connected.
WARNING: cannot verify jp.c.misumi-ec.com's certificate, issued by `/C=US/O=Amazon/OU=Server CA 1B/CN=Amazon':
Unable to locally verify the issuer's authority.
HTTP request sent, awaiting response... 200 OK
Length: 622420 (608K) [application/pdf]
Saving to: `0013.pdf'
100%[===========================================================================================================
2020-11-13 17:36:22 (4.03 MB/s) -
`0013.pdf' saved
[622420/622420]
作者:
qxdbat
时间:
2020-11-16 09:02
回复
2#
Batcher
https://jp.misumi-ec.com/vona2/detail/221000055825/
[attach]12893[/attach]
作者:
Batcher
时间:
2020-11-16 10:17
回复
3#
peterboy666
楼主的问题可能侧重于如何在htm文件中找到pdf的下载地址
作者:
wujunkai
时间:
2020-11-16 19:18
回复
4#
qxdbat
能把下载地址也给一下吗。我实在找不到 .pdf
作者:
wujunkai
时间:
2020-11-16 19:29
我找到了,可惜电脑没带回来
这里给个思路
findstr找到有 openSubWindow 的那一行,其实有两行,随便哪一行都可以
然后提取里面的链接,这个需要比较强的功底
楼主给的例子里面提取的链接是
jp.c.misumi-ec.com/book/YKO1_02/digitalcatalog.html?page_num=85
下载地址是
jp.c.misumi-ec.com/book/YKO1_02/pdf/0085.pdf
关系一目了然
欢迎光临 批处理之家 (http://bbs.bathome.net/)
Powered by Discuz! 7.2