Board logo

标题: [文本处理] 批处理输入chcp65001后仍然存在中文乱码问题 [打印本页]

作者: pythias    时间: 昨天 20:19     标题: 批处理输入chcp65001后仍然存在中文乱码问题

本代码实现的是计算当前目录下所有cpp后缀文件的总行数
  1. @echo off
  2. chcp 65001 > nul
  3. set line=0
  4. dir /b /s | find ".cpp" | find /v /i"cmake" > 1.txt
  5. for /f "tokens=1* delims=" %%a in (1.txt) do (
  6. for /f "tokens=1* delims=" %%b in (%%a) do set /a line+=1
  7. )
  8. pause
  9. del 1.txt
  10. echo %line%
  11. pause
复制代码
但是在写入1.txt的时候会出现部分字符乱码的情况,并且每次运行时乱码的字符都有些不一样
这是为什么呢?




这就导致第二个for循环到这几行的时候无法正常作为文件路径读取文件


另外一个小问题,报错的前三行文件路径为什么在空格处被分割了呢,明明已经加了"tokens=1* delims="

作者: aloha20200628    时间: 昨天 21:11

回复 1# pythias

用以下代码可直接获取文件名不包含‘cmake’的全部c++文件个数
  1. dir /b/s/a-d *.cpp | find /v /i /c "cmake"
复制代码

作者: pythias    时间: 昨天 21:23

回复 2# aloha20200628


    我想要统计的,是所有cpp文件里面一共写了多少行代码
作者: aloha20200628    时间: 昨天 21:36

本帖最后由 aloha20200628 于 2024-9-28 21:54 编辑

回复 3# pythias
  1. @echo off
  2. for /f "delims=" %%F in ('dir /b/s/a-d *.cpp^|find /v /i "cmake" ') do (
  3. for /f %%n in ('find /v /c "" ^<"%%F" ') do set/a n+=%%n
  4. )
  5. echo,%n%
  6. pause&exit/b
复制代码

作者: pythias    时间: 昨天 22:30

回复 4# aloha20200628


    很好的思路,学习到了,但是我还是好奇为什么我的写法会出错,中文乱码问题我遇见很多次了
作者: Five66    时间: 昨天 23:35

啊,不是应该会卡在
dir /b /s | find ".cpp" | find /v /i"cmake" > 1.txt
这一行

简体中文系统默认是gbk,如果没有gbk无法表示的字符就不要用chcp 65001
chcp 65001 属于是 it just works,问题多多的

另外吐槽一下,unicode的1200代码页仅适用于托管应用程序
作者: 77七    时间: 昨天 23:39

回复 1# pythias



最后的问题,参考 批处理for语句从入门到精通 4楼末尾
作者: Batcher    时间: 2 小时前

回复 1# pythias


另外一个小问题,报错的前三行文件路径为什么在空格处被分割了呢,明明已经加了"tokens=1* delims="

去掉 tokens=1*
只保留 delims=




欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2