[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖
本帖最后由 娜美 于 2024-5-10 10:38 编辑

非常感谢@went
希望在转换编码过程中,顺便把unix  mac  dos格式也并统一解决了
例如将不同文本unix  mac  dos格式, 统一变成DOS/ASNI编码格式

变成dos/utf-8
coder -c auto dos/unix/mac==dos/utf-8 -f a.txt >b.txt

TOP

本帖最后由 娜美 于 2024-5-10 10:39 编辑

楼主有一些优化建议, 楼主开发命令行工具非常优秀

例如: 在判断编码的过程.
  1. coder.exe -s -a gc -f
复制代码
是不是还能做一些优化, 现在是需要从头到尾读一遍才能判断出是那一种编码,  
if 文件很多,  又很大情况下, 从头到尾读一遍可能需要很多时间和资源哦

if 它可以只读文本头标识的前几行, 就能马上判断出属于那一种编码吗, 这是不是一种更好优化方案? 更好,更快,更强 更省时间

但这是想法,  要实现它又是另一回事了

TOP

本帖最后由 娜美 于 2024-5-13 21:06 编辑

楼主,  报告一个问题, 不能检测大于2GB文件吗 ?    相同文件试用uchardet是可以,  楼主要重现此问题,  请偿试制造1个 或 多个 大于2GB大文件 或 更大的任何内容文件用于实验
  1. coder -s -a gc -f "0.txt"
  2. 文件打开失败! Error:8
  3. 文件打开失败! Error:1006
  4. 请按任意键继续. . .
复制代码

TOP

本帖最后由 娜美 于 2024-6-13 16:35 编辑

回复 77# went


今天才看到楼主更新了,    测了一下,  如果是DOS/UTF-16_BE文件,  会被判断为MAC/UTF-16_BE, 其它的没有问题

这有一些简单测试文件, 请看看
https://wwm.lanzoul.com/iKgZ421plawh

另建议将获得编码值样式 DOS/UTF-16_BE 改为  UTF-16_BE/DOS 样式,  将格式放在后面。让大家灵活取分隔"_"  或 "/" 即可 ( 因为有些直接取UTF-16或UTF-8值就行 不需要获取整个字段 "UTF-16_BE" )    可以让其它获取该值脚本写得更简单, 行数更少,
之前旧脚本代码也不需要添加行数或更改, 起到承上启下作用
再加快读取文件速度
更新后的coder越来越比uchardet好用了

TOP

本帖最后由 娜美 于 2024-6-13 22:53 编辑

我再深入测试将78层连接文件全部统一为UTF-8/DOS,   有一些MAC Unix格式文件似乎没有转为DOS,  这可能是UltraEdit的问题
  1. for /r %%a in (*.txt) do (
  2.    echo,
  3.    coder -c auto utf-8 -f "%%a"
  4. )>%%a.tmp
复制代码

TOP

回复  


    需要两步一次只能转换编码与格式其中一种,2选1,不能同时转换
went 发表于 2024-6-13 23:18



   哦哦 thanks

TOP

本帖最后由 娜美 于 2024-11-23 10:18 编辑

Hi, @went
base64编码转化成文件  当base64文本编码,如果行首有空一行情况不行

TOP

返回列表