找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 22130|回复: 4

[文本处理] htox32c转换htm2txt 汉字乱码

[复制链接]
发表于 2011-10-8 17:09:51 | 显示全部楼层 |阅读模式
遇上加了/IP参数还是乱码的怎么办?
htm文件使用记事本打开时是UTF-8编码的。
  1. @echo off
  2. curl -o 123.txt http://www.sge.sh/publish/sge/xqzx/jyxq/index.htm
  3. md htm
  4. pause
  5. title 下载数据文件
  6. set n=0
  7. setlocal enabledelayedexpansion
  8. for /f "delims=><= tokens=4skip=170" %%i in (123.txt) do (
  9. set a=%%i
  10. echo http://www.sge.sh/publish/sge/xqzx/jyxq/%%i
  11. if "!a:~-4,3!"=="htm" set /a n+=1 & echo %%i !n! & curl -o htm\!n!.htm  http://www.sge.sh/publish/sge/xqzx/jyxq/%%i
  12. )

  13. title 转换文件格式
  14. HtoX32c /ip /O0 htm\*.htm
  15. md txt 2>nul
  16. move htm\*.txt txt\>nul
  17. pause
  18. exit
复制代码
发表于 2011-10-8 17:35:16 | 显示全部楼层
这个网站的CHARSET是UTF-8,没什么说的
试一下HtoX32c /i8 /O0 htm\*.htm(HtoX32c,curl我这儿都没有,也懒得下了)
 楼主| 发表于 2011-10-8 17:41:39 | 显示全部楼层
回复 2# wc726842270


    换成/i8 也是乱码
发表于 2011-10-8 17:50:20 | 显示全部楼层
呵呵,这个没有做试验,给你个网址也许对你有帮助:
【原创】用批处理+curl+HtoX32c整理中国医药网上的医院名录信息http://bbs.et8.net/bbs/showthread.php?t=1014614
发表于 2011-10-8 18:50:37 | 显示全部楼层
刚才无聊做了一下试验,发现HtoX32c可以将GB2312正常转换(也就是说没有乱码),而LZ所提供的网站是用UTF-8的,所以出现的点问题,有兴趣可以用VBS下载
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-18 03:07 , Processed in 0.017139 second(s), 8 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表