[原创教程] [总结]Perl在遇到Unicode字符文件名时的各种处理方法

Rank: 7 Rank: 7 Rank: 7

帖子: 3151
积分: 6455
技术: 317
捐助: 70
注册时间: 2008-8-3

3楼

发表于 2015-3-27 16:27 | 只看该作者

本帖最后由 523066680 于 2015-3-27 16:32 编辑

回复 2# CrLf

然后用Perl撸了一个将备份目录和源目录之间差异的文件进行提取的脚本。
准备改撸C艹但是估计要好长时间摸索了

FuniCode 编程论坛

CrLf

论坛巡查

Rank: 8 Rank: 8

帖子: 6388
积分: 18843
技术: 982
捐助: 100
注册时间: 2010-10-9

4楼

发表于 2015-3-27 16:37 | 只看该作者

差异文本是什么概念，以什么为依据？

链接：在线第三方命令行工具下载 bat、vbs、js 原生混编

Rank: 7 Rank: 7 Rank: 7

帖子: 3151
积分: 6455
技术: 317
捐助: 70
注册时间: 2008-8-3

5楼

发表于 2015-3-27 16:40 | 只看该作者

本帖最后由 523066680 于 2015-3-27 16:59 编辑

回复 4# CrLf

文件，不是文本。
用Robocopy的做目录同步的时候，如果选择 /MIR模式，会删除、替换三种文件：较旧的文件，较新的文件，多出的文件
然后撸了一个Perl专门提取这三种文件，支持unicode字符的路径、文件名

之前看到论坛有人介绍 SyncToy，试了一下，可以保留同步过程中被删除的文件，但是被统一存放在垃圾桶里…… 并且不包含目录结构

FuniCode 编程论坛

Rank: 7 Rank: 7 Rank: 7

帖子: 3151
积分: 6455
技术: 317
捐助: 70
注册时间: 2008-8-3

6楼

发表于 2015-5-23 08:42 | 只看该作者

回复 6# tigerpower

感谢分享，省了很多繁琐。

FuniCode 编程论坛

Rank: 7 Rank: 7 Rank: 7

帖子: 3151
积分: 6455
技术: 317
捐助: 70
注册时间: 2008-8-3

7楼

发表于 2017-3-12 11:32 | 只看该作者

本帖最后由 523066680 于 2017-3-12 11:38 编辑

tigerpower 曾经在这里回复推荐了 Win32::Unicode，然后他自己删了帖。

我以前执着于用自带的模块做文件系统的事情，现在想想真没必要，应该怎么方便怎么来。

这里重新补充

http://bbs.bathome.net/redirect. ... 89&fromuid=3337

use Win32::Unicode;
use utf8;
my $dirname="CreateDir・测试";
my $dirname_long="CreateDir・测试1/CreateDir・测试2/CreateDir・测试3";
my $dirname_new="CreateDir・测试・新";
my $filename="CreateFile・测试";

mkdirW $dirname;
chdirW $dirname;
mkpathW $dirname_long;
$fh = Win32::Unicode::File->new('>', $filename);
$fh->close;
chdirW $dirname_long;
touchW $filename.'1';
chdirW '../../../..';
cptreeW $dirname.'/',$dirname_new;
复制代码

FuniCode 编程论坛

Rank: 7 Rank: 7 Rank: 7

帖子: 3151
积分: 6455
技术: 317
捐助: 70
注册时间: 2008-8-3

8楼

发表于 2019-2-23 18:05 | 只看该作者

本帖最后由 523066680 于 2019-2-23 18:07 编辑

Chilkat模块亦支持unicode字符路径，而且还挺好用（这个模块很早就知道了，官网示例很齐全，就是没怎么用过）

CkDirTree参考文档
dirTree_iterate示例

对官方示例稍作修改，通过 put_Utf8 打开编码开关：

use chilkat();
use File::Slurp;
$dirTree = chilkat::CkDirTree->new();
$dirTree->put_BaseDir("F:/temp/UPathTest");
$dirTree->put_Recurse(1);
$dirTree->put_Utf8(1); 
$success = $dirTree->BeginIterate();
if ($success != 1) {
    print $dirTree->lastErrorText() . "\r\n";
    exit;
}

my $buff = "";
while ($dirTree->get_DoneIterating() != 1)
{
    $buff .= $dirTree->fullPath() . "\r\n";
    #  Advance to the next file or sub-directory in the tree traversal.
    $success = $dirTree->AdvancePosition();
    if ($success != 1) {
        if ($dirTree->get_DoneIterating() != 1) {
            print $dirTree->lastErrorText() . "\r\n";
            exit;
        }
    }
}
write_file("Files.txt", {"binmode"=>":raw"}, $buff );
复制代码

FuniCode 编程论坛