标题: [问题求助] perl截取中文为何是乱码 [打印本页]
作者: FOR 时间: 2011-10-6 05:44 标题: perl截取中文为何是乱码
perl截取中文为何是乱码
a.txt中是中文,我想对它进行截取,可发现截取的为奇数时乱码,该如何处理?- open var,"<a.txt";
- foreach (<var>) {
- print substr($_,1);
- }
复制代码
作者: sxw 时间: 2011-10-8 19:41
需要加载 Encode模块,不知道你的原文件是什么格式的?权当utf-8吧
仅是思路,不知道对不。- use Encode;
- open var,"<a.txt";
-
- foreach (<var>) {
- $_=encode("utf-8",$_);
- print substr(decode("gb2312",$_),1);
-
- }
复制代码
作者: 523066680 时间: 2015-6-3 19:26
本帖最后由 523066680 于 2015-6-3 19:32 编辑
楼主需要弄清楚文本保存的时候的各种编码格式的区别
(反正就是要跨越文字编码这道坎)
对a.txt 右键另存的时候可以看到是 ANSI 还是 UTF8 还是 UTF16LE / UTF16BE
假设终端是WINDOWS的,对应CP936编码,现在要读取并显示UTF8文本并显示,可以:- use Encode;
- open READ,"<:encoding(utf8)", "a.txt"; #按utf8编码解读,变成unicode通用码
- foreach (<READ>) {
- print encode('cp936', $_); #将通用码转为CP936以对应终端编码
- }
复制代码
:encoding(utf8) 这样的用法好像叫做 IO Layer,可以在perlmonks查一下
欢迎光临 批处理之家 (http://bbs.bathome.net/) |
Powered by Discuz! 7.2 |