- findstr /i "的" 1.txt&&goto wc || @iconv -c -f utf-8 -t GBK 1.txt>>gb1.txt
- findstr /i "的" gb1.txt&&move /y gb1.txt 1.txt&&goto wc || @iconv -c -f utf-32 -t GBK 1.txt>>gb2.txt
- findstr /i "的" gb2.txt&&move /y gb2.txt 1.txt&&goto wc || @iconv -c -f UCS-2LE -t GBK 1.txt>>gb3.txt
- findstr /i "的" gb3.txt&&move /y gb3.txt 1.txt
- :wc
- del /q gb*.txt
- echo 完成
- findstr /iv "ps2 ps3 ps" 1.txt>>2.txt
- pause
复制代码 http://bcn.bathome.net/s/tool/index.html?key=iconv
这是一个文件处理的苯办法,utf-8 和unicode 测试都成功。utf-32,软件iconv是支持的,但我没有这样的文件,也不会保存为这样的文件。所以这个只是臆测写了。
其他什么格式的文件,不知道还能有什么格式,所以没有多写。 查找 的 字的目的是中文的字的字频最高。处理英文可以用 the |