找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 30513|回复: 2

[网络连接] [已解决]wget下载的网页源码是乱码

[复制链接]
发表于 2018-10-31 19:35:11 | 显示全部楼层 |阅读模式
本帖最后由 hlzj88 于 2018-11-1 22:21 编辑

各位论坛大佬,请教了
问题如题,下载顶点的圣墟,这是其中两个地址

wget --user-agent="Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.3) Gecko/2008092416 Firefox/3.0.3" --no-check-certificate -e robots=off -c -t 0 -T 40 "https://www.23us.so/files/article/html/13/13694/13271729.html"

wget --user-agent="Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.3) Gecko/2008092416 Firefox/3.0.3" --no-check-certificate -e robots=off -c -t 0 -T 40 "https://www.23us.so/files/article/html/13/13694/13122995.html"

第1个下载后的文件源码是乱码,另存为下是 ansi编码,第2个是正常的,另存为是 utf-8编码。
在浏览器上查看上面两个地址的源码都是正常的。

请教有何办法破解并兼容,最好是在wget软件的基础上。
发表于 2018-11-1 07:54:39 | 显示全部楼层
本帖最后由 523066680 于 2018-11-1 08:18 编辑

回复 1# hlzj88

    可能该页面特殊,默认返回gzip格式,改名为.zip,解压后就有了。
干脆统一请求gzip格式,获取后统一解压。

wget --header="Accept-Encoding:gzip" --no-check-certificate -e robots=off -c -t 0 -T 40 "https://www.23us.so/files/article/html/13/13694/13271729.html" --adjust-extension
 楼主| 发表于 2018-11-1 22:14:56 | 显示全部楼层
谢谢 523066680 版主,如你说进行操作,能得到正确网页。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-18 18:55 , Processed in 0.017398 second(s), 8 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表