Board logo

标题: [文本处理] [已解决] findstr命令对于UTF-8文本处理的不兼容 [打印本页]

作者: pZjVa0    时间: 2013-7-1 22:14     标题: [已解决] findstr命令对于UTF-8文本处理的不兼容

本帖最后由 pZjVa0 于 2013-7-2 10:02 编辑

最初处理时用了最简单的代码
  1. FINDSTR /i " 簡介 简介 资源类型" x.txt>nu&&echo 找到||echo 没找到
  2. pause
复制代码
后面发现当文本是UTF-8时无论关键词是什么结果都是 false

我查了一下网上对于批处理对UTF-8的资料非常少

1.请教一下各位有办法可以对UTF-8的内容进行检测吗?

2.对于文本的编码仅用批处理能不能达到文本编码的效果?谢谢
作者: xxpinqz    时间: 2013-7-1 23:40

http://www.bathome.net/thread-10861-1-1.html
批处理utf-8编码文件要先转为ansi
善用下论坛提供的搜索功能
作者: Bearxy    时间: 2013-7-1 23:56

你试试用TYPE读文件看看。
作者: CrLf    时间: 2013-7-2 02:21

xp 以上(不含 xp)可以把 bat 存为 utf-8,在头部加个 &@cls&chcp>nul 65001,这样就能且只能 findstr utf-8 文件了
作者: pZjVa0    时间: 2013-7-2 11:57

回复 4# CrLf


    加了这个代码后闪退怎么破
作者: CrLf    时间: 2013-7-2 15:38

回复 5# pZjVa0


    &前加个空格
作者: PowerShell    时间: 2013-7-2 18:32

本帖最后由 PowerShell 于 2013-7-2 18:37 编辑

这个问题是世界难题,findstr,和 linux中的 grep 都没解决,(在不用重新生成文件的情况下,或者说不用先把文件转码的情况下)被powershell解决了。
你说powershell牛不?

select-string 中有个 -encodeing
作者: terse    时间: 2013-7-2 18:48

powershell牛
作者: Python    时间: 2013-7-3 08:30

回复 7# PowerShell


    给个能够解决楼主问题的完整代码让大家学习下呗
作者: PowerShell    时间: 2013-7-3 18:50

双击powershell
select-string "簡介 简介 资源类型" x.txt  -encoding  xxx
即可。
---------------把 xxx 替换成下述内容 --------------------------
-Encoding <string>
指定 Select-String 在搜索文件时应采用的字符编码。默认值为 UTF8。

有效值包括“UTF7”、“UTF8”、“UTF32”、“ASCII”、“Unicode”、“BigEndianUnicode”、“Default”和“OEM”。“Default”是系统当前 ANSI 代码页的编码。“OEM”是操作系统的当前原始设备制造商代码页标识符。
作者: apang    时间: 2013-7-3 19:12

不明,觉厉
PowerShell斑竹是不是弄个基础教程,方便我等菜鸟学习?
作者: karmane    时间: 2022-3-25 22:48

回复 4# CrLf
这个牛啊。。。。




欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2