标题: [文本处理] 这样理解sed对不对 [打印本页]
作者: wanghan519 时间: 2024-4-23 16:36 标题: 这样理解sed对不对
今天遇到个问题,要把很多个文本里的0替换成1,文本很短,就1-2行,0也就出现一次,我就没多想用powershell大概这样写- (gc a.txt) -replace '0','1' | out-file -encoding oem b.txt
复制代码
对大多数文件没出错
但是
有几个文件是二进制编码,但用记事本打开能看到一部分正常的字符
这替换出来就错了不少。。。
后来改成- sed 's/0/1/' a.txt > b.txt
复制代码
暂时没有出错
就想问问大家,sed替换是不管字符编码的吗,这样理解是否正确,这种替换方式是否安全,是否需要把二进制的文件先转16进制数的表达方式,然后找到数字替换后再转回二进制?
谢谢啦
作者: Five66 时间: 2024-4-23 17:38
无非就2种
使用某一编码作为默认编码或自动判断编码
powershell是默认的
sed好像也是默认的,貌似会忽略无法解码的
作者: wanghan519 时间: 2024-4-23 17:48
回复 2# Five66
多谢
又搜了一会,好像不同sed版本不太一样,不过powershell确实默认就解码了,然后就丢了一部分信息。。。
我这用的busybox sed,不管编码只是替换,用在这里方便一点
谢谢
欢迎光临 批处理之家 (http://bbs.bathome.net/) |
Powered by Discuz! 7.2 |