找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 21295|回复: 1

[文本处理] 无聊之作批处理版 gbk2utf8 编码转换

[复制链接]
发表于 2012-2-15 13:02:25 | 显示全部楼层 |阅读模式
本帖最后由 plp626 于 2012-2-15 13:34 编辑
  1. ::原理:gbk 转 unicode 然后 unicode 转 utf8
  2. :: unicode 转 utf8 算法:"b1=224|a1>>4,b2=128|a1%%16*4|a2>>6,b3=128|a2%%64"
  3. ::需要外部工具:fc.exe(系统默认自带),chcp.exe(系统默认自带)
  4. ::         ascmap.cmd 下载 http://www.bathome.net/thread-12347-1-1.html
  5. ::         hex.cmd 下载 http://www.bathome.net/viewthread.php?tid=12688
  6. ::用法: 所转换的文件命名为test.txt(默认ascii编码)存放在当前目录下,双击之即可
  7. ::其他: 该代码仅为实现功能,效率很低,仅适合小文本,有致命bug(看你能找到否?,呵呵);

  8. @echo off||code by plp
  9. setlocal enabledelayedexpansion
  10. cmd /u /c "type test.txt>test.tmp"||(pause&exit)
  11. call ascmap.cmd /437 $
  12. Set str=
  13. for /f "tokens=1-2" %%a in ('hex.cmd test.tmp 2')do (
  14.         if %%b==00 (
  15.                 Set str=!str!!$:~0x%%a,1!
  16.         )else (
  17.                 set/a a1=0x%%b,a2=0x%%a
  18.                 set/a "b1=224|a1>>4,b2=128|a1%%16*4|a2>>6,b3=128|a2%%64"
  19.                 for /f "tokens=1-3" %%c in ("!b1! !b2! !b3!")do (
  20.                         Set str=!str!!$:~%%c,1!!$:~%%d,1!!$:~%%e,1!
  21.                 )
  22.         )
  23. )
  24. ECHO !str!>test-utf8.txt
  25. start test-utf8.txt
  26. pause
复制代码
期待 utf8 转 gbk (截除高位1110 10  10 字节)的诞生,大伙练练手。。

评分

参与人数 2技术 +2 收起 理由
bailong360 + 1 gj
CrLf + 1 nice

查看全部评分

发表于 2013-2-21 11:24:42 | 显示全部楼层
学习一下,很好
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-17 01:26 , Processed in 0.016308 second(s), 9 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表