找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 20206|回复: 2

[问题求助] perl截取中文为何是乱码

[复制链接]
发表于 2011-10-6 05:44:03 | 显示全部楼层 |阅读模式
perl截取中文为何是乱码
a.txt中是中文,我想对它进行截取,可发现截取的为奇数时乱码,该如何处理?
  1. open var,"<a.txt";
  2. foreach (<var>) {
  3.         print substr($_,1);
  4. }
复制代码
发表于 2011-10-8 19:41:26 | 显示全部楼层
需要加载 Encode模块,不知道你的原文件是什么格式的?权当utf-8吧
仅是思路,不知道对不。

  1. use Encode;
  2. open var,"<a.txt";

  3. foreach (<var>) {
  4.        $_=encode("utf-8",$_);
  5.         print substr(decode("gb2312",$_),1);

  6. }

复制代码
发表于 2015-6-3 19:26:26 | 显示全部楼层
本帖最后由 523066680 于 2015-6-3 19:32 编辑

楼主需要弄清楚文本保存的时候的各种编码格式的区别
(反正就是要跨越文字编码这道坎)

对a.txt 右键另存的时候可以看到是 ANSI 还是 UTF8 还是 UTF16LE / UTF16BE

假设终端是WINDOWS的,对应CP936编码,现在要读取并显示UTF8文本并显示,可以:
  1. use Encode;
  2. open READ,"<:encoding(utf8)", "a.txt";    #按utf8编码解读,变成unicode通用码
  3. foreach (<READ>) {
  4.     print encode('cp936', $_);            #将通用码转为CP936以对应终端编码
  5. }
复制代码
:encoding(utf8) 这样的用法好像叫做 IO Layer,可以在perlmonks查一下
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-17 05:46 , Processed in 0.017084 second(s), 8 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表