[批处理命令一日一教学 续](13)字符串查找增强:findstr
【原】[一日一教学]批处理系列帖子索引 [url]http://bbs.bathome.net/thread-2576-1-1.html[/url]【续】[一日一教学]批处理系列帖子索引 [url]http://bbs.bathome.net/thread-13798-1-1.html[/url]
[color=Green]帮助信息:[/color][code]在文件中寻找字符串。
FINDSTR [/B] [/E] [/L] [/R] [/S] [/I] [/X] [/V] [/N] [/M] [/O] [/P] [/F:file]
[/C:string] [/G:file] [/D:dir list] [/A:color attributes] [/OFF[LINE]]
strings [[drive:][path]filename[ ...]]
/B 在一行的开始配对模式。
/E 在一行的结尾配对模式。
/L 按字使用搜索字符串。
/R 将搜索字符串作为正则表达式使用。
/S 在当前目录和所有子目录中搜索匹配文件。
/I 指定搜索不分大小写。
/X 打印完全匹配的行。
/V 只打印不包含匹配的行。
/N 在匹配的每行前打印行数。
/M 如果文件含有匹配项,只打印其文件名。
/O 在每个匹配行前打印字符偏移量。
/P 忽略有不可打印字符的文件。
/OFF[LINE] 不跳过带有脱机属性集的文件。
/A:attr 指定有十六进位数字的颜色属性。请见 "color /?"
/F:file 从指定文件读文件列表 (/ 代表控制台)。
/C:string 使用指定字符串作为文字搜索字符串。
/G:file 从指定的文件获得搜索字符串。 (/ 代表控制台)。
/D:dir 查找以分号为分隔符的目录列表
strings 要查找的文字。
[drive:][path]filename
指定要查找的文件。
除非参数有 /C 前缀,请使用空格隔开搜索字符串。
例如: 'FINDSTR "hello there" x.y' 在文件 x.y 中寻找 "hello" 或
"there"。'FINDSTR /C:"hello there" x.y' 文件 x.y 寻找
"hello there"。
正则表达式的快速参考:
. 通配符: 任何字符
* 重复: 以前字符或类出现零或零以上次数
^ 行位置: 行的开始
$ 行位置: 行的终点
[class] 字符类: 任何在字符集中的字符
[^class] 补字符类: 任何不在字符集中的字符
[x-y] 范围: 在指定范围内的任何字符
\x Escape: 元字符 x 的文字用法
\<xyz 字位置: 字的开始
xyz\> 字位置: 字的结束
有关 FINDSTR 常见表达法的详细情况,请见联机命令参考。
[/code][quote]这则帮助信息中,我将[color=Red]“一般表达式”[/color],全部替换成了[color=Red]“正则表达式”[/color](一切都是机器翻译惹的祸)。[/quote]
[color=Green]命令概括:[/color]
findstr,全英文find string,意为“查找字符串”;
/b,全英文begin,意为“开始”;
/e,全英文end,意为“末端”;
/l,literally,意为“照字面地”;引申为“去正则表达式”。
/r,regular,意为“有规律的”;引申为“正则表达式”。
/s,subdirectory,意为“子目录”;
/i,ignore,意为“忽略”;引申为“忽略大小写”;
/x,exactly,意为“恰好地”;引申为“完全匹配”;(一开始意为不是这个单词,不过HAT确实高明——之所以以e为缩写,是因为前面有了end的缩写,所以以第二个字母x为缩写)。
/v,invert,意为“反转、使颠倒”[color=Red](感谢doupip的单词提供);[/color]
/n,全英文number,意为“数字”;引申为“行号”;
/m,merely,意为“只是”;
/o,offset,意为“偏移”;
/p,print,意为“打印”;
/off[line],意为“脱机文件”;
/a,attribute,意为“属性”;
/f,file,意为“文件”;
/c,case,意为“把几个字加起来”;引申为“全部字匹配”;
/g,get,意为“获得”;
/d,directory,意为“目录”;
class,类。
[color=Red]感谢HAT的单词提供。
感谢weichengxiehou。
参数详解部分13-14节都是从weichengxiehou的帖子里复制来的(既然有现成了,省心多少),[url=http://bbs.bathome.net/viewthread.php?tid=11159&extra=page%3D1&ordertype=2]原帖地址[/url]。[/color]
[color=Green]参数详解:[/color]
学习findstr需要大量的实践体会,所以需要新建一些txt文本以供测试。
a.txt的内容(a.txt的内容在后面会多次修改,请注意!):[code]Hello World
Hello Boy
hello ,good man.
goodbye![/code]1.最简单的应用:在指定文本中查找指定字符串
代码:[code]findstr "hello" a.txt[/code]结果:[code]C:\Users\helloworld\Desktop>findstr "hello" a.txt
hello ,good man.[/code]代码:[code]findstr "Hello" a.txt[/code]结果:[code]C:\Users\helloworld\Desktop>findstr "Hello" a.txt
Hello World
Hello Boy[/code]这里可以看出,[quote]findstr[color=Red]默认是区分大小写的[/color](跟find命令一样)——找hello就不会出现Hello,反之亦然。[/quote]
怎么让其不区分大小写呢?
用/i参数!
例如:[code]C:\Users\helloworld\Desktop>findstr /i "Hello" a.txt
Hello World
Hello Boy
hello ,good man.[/code]2.显示要查找的字符具体在文本哪一行
代码:[code]C:\Users\helloworld\Desktop>findstr /n /i "hello" a.txt[/code]效果:[code]1:Hello World
2:Hello Boy
3:hello ,good man.[/code]显示的结果中冒号(:)是英文格式下的,在用for提取的时候需要注意!
这里可以对比一下find命令的/n参数:
代码:[code]C:\Users\helloworld\Desktop>find /n "hello" a.txt[/code]效果:[code]---------- A.TXT
[3]hello ,good man.[/code]冒号(:)和中括号([]),这就是差别,编写代码的时候一定要注意。
3.查找包含了指定字符的文本
代码:[code]C:\Users\helloworld\Desktop>findstr /m /i "hello" *.txt[/code]效果:[code]1.txt
a.txt
[/code]1.txt中的类容如下:[code]
除非参数有 /C 前缀,请使用空格隔开搜索字符串。
例如: 'FINDSTR "hello there" x.y' 在文件 x.y 中寻找 "hello" 或
"there"。'FINDSTR /C:"hello there" x.y' 文件 x.y 寻找
"hello there"。
[/code]由于加上了/m参数,所以只列出包含指定字符的文件名。
4.查找以指定字符开始或结尾的文本行
这个功能和前面介绍的最大不同就在于涉及到了“元字符”,如果你不明白什么是“元字符”,那也不用担心学不好这一节,这就好像不明白“water”是什么,也不会影响喝水。
a.txt内容:[code]good hello
你好 hello world
Hello World
Hello Boy
hello ,good man.
goodbye![/code][color=Red]如何查找以hello(忽略大小写)开始的行?[/color]
两种方法:
①./b参数
代码:[code]C:\Users\helloworld\Desktop>findstr /b /i "hello" a.txt[/code]效果:[code]Hello World
Hello Boy
hello ,good man.[/code]good hello 和 你好 hello world,这两行都没有显示出来,因为hello不在行的开始处。
②.^符
这里的^可不是转义符,而是正则表达式中的“匹配行开始的位置”。
代码:[code]C:\Users\helloworld\Desktop>findstr /i "^hello" a.txt[/code]效果:[code]Hello World
Hello Boy
hello ,good man.[/code]学完了以查找指定字符开始的行,下面学习查找以指定字符结尾的行。
[color=Red]如何查找以hello(忽略大小写)结尾的行?[/color]
同样有两种方法:
①./e参数
代码:[code]C:\Users\helloworld\Desktop>findstr /e /i "hello" a.txt[/code]结果:[code]good hello[/code]只显示了“good hello”,因为其它行虽然有“hello”,但是他们都没有以“hello”结尾。
②.$符
代码:[code]C:\Users\helloworld\Desktop>findstr /i "hello$" a.txt[/code]结果:[code]good hello[/code]到此,我们已经学习了两个正则表达式的元字符:^和$(分别和他们功能相对应的有/b、/e参数)。
5.查找与指定字符完全匹配的行
首先修改a.txt的内容:[code]hello
hello hello
good hello
你好 hello world
Hello World
Hello Boy
hello ,good man.
goodbye![/code]懂得举一反三的的童鞋可能会试着尝试以下代码:[code]C:\Users\helloworld\Desktop>findstr /n /i "^hello$" a.txt
[/code]结果让你倍感欣喜:[code]1:hello[/code]其实除了这一种方法外,findstr命令还提供了/x参数用来查找完全匹配的行。
代码:[code]C:\Users\helloworld\Desktop>findstr /n /i /x "hello" a.txt[/code]结果:[code]1:hello[/code].
6.关闭正则表达式会怎么样?
我们可以人为地将findstr分为两种模式,“正则表达式模式”和“普通字符串模式”。
findstr默认为“正则表达式模式”,加上/r参数也是“正则表达式模式”[color=Silver]此说法不太准确→(换言之,/r参数有点多余)[/color]。
[color=Red]2021-01-11 补充:[/color]
[quote]findstr 命令参数 /c 和 /r 的不同用处一例
[url]http://bbs.bathome.net/thread-14682-1-1.html#pid99416[/url]
findstr 命令使用 /r 的时候需要注意转义字符的特殊处理
[url]http://bbs.bathome.net/thread-498-1-1.html[/url]
BAT命令findstr中/R参数的思考
[url]http://bbs.bathome.net/thread-57534-1-1.html[/url]
[/quote]
加上/l参数后,findstr转换为“普通字符串模式”(其实find就是这种模式、且只有这种模式)。
“普通字符串模式”下,以同样的代码,看看结果怎样?
代码:[code]C:\Users\helloworld\Desktop>findstr /li "^hello" a.txt[/code]结果什么都没显示出来。
以hello开头的行明明有以下这些,为什么没显示出来呢?[code]hello hello
Hello World
Hello Boy
hello ,good man.[/code][quote]因为,当你使用“普通字符串模式”,findstr不会把^当做是正则表达式的元字符,而只是把其当做普通字符^,也就是说它此时已经不具备“表示行首”的功能,变成了和h之类字符一样的普通民众,再也没“特权”。[/quote]
改变a.txt的内容:[code]^hello
hello
hello hello
good hello
你好 hello world
Hello World
Hello Boy
hello ,good man.
goodbye![/code]再次运行代码:[code]C:\Users\helloworld\Desktop>findstr /nli "^hello" a.txt[/code]结果:[code]1:^hello[/code].
7.查找不包含指定字符的行
如果比较一下find和findstr命令就会发现,他们都具有/v,/n,/i,/off[line]参数,而且功能都是一摸一样的,这里说的就是/v参数。
查找不包含hello的行。
代码:[code]C:\Users\helloworld\Desktop>findstr /vni "hello" a.txt[/code]结果:[code]9:goodbye![/code].
8.如何查找当前目录及子目录下文件内容中包含某字符串的文件名?
在写这篇教程的时候,偶然看到有批友问了这个问题,问题地址:[url]http://bbs.bathome.net/viewthread.php?tid=14727[/url]
代码:[code]findstr /ms "专业" *.txt[/code]效果:
找出当前目录及子目录下文件内容中包含“专业”的文本文件,并只显示其文件名。
9.用文本制定要查找的文件 And 用文本制定要查找的字符串
[color=Red]用文本制定要查找的文件[/color]
新建一个file.txt,内容如下(这个文本中指定findstr要查找的文本的路径):[code]C:\Users\helloworld\Desktop\1.txt
C:\Users\helloworld\Desktop\a.txt
C:\Users\helloworld\Desktop\clip.txt
C:\Users\helloworld\Desktop\CrLf 批处理笔记.txt
C:\Users\helloworld\Desktop\file.txt
C:\Users\helloworld\Desktop\MyRarHelp.txt
C:\Users\helloworld\Desktop\test.txt
C:\Users\helloworld\Desktop\红楼.txt
C:\Users\helloworld\Desktop\520\新建文本文档.txt
C:\Users\helloworld\Desktop\520\12\hello_ world.txt
C:\Users\helloworld\Desktop\编程\help.txt
C:\Users\helloworld\Desktop\编程\win7 help比xp help多出来的命令.txt
C:\Users\helloworld\Desktop\编程\wmic.txt[/code].
代码:[code]C:\Users\helloworld\Desktop>findstr /f:file.txt /im "hello"[/code]效果:[code]C:\Users\helloworld\Desktop\1.txt
C:\Users\helloworld\Desktop\a.txt
C:\Users\helloworld\Desktop\CrLf 批处理笔记.txt
C:\Users\helloworld\Desktop\file.txt
C:\Users\helloworld\Desktop\test.txt[/code].
[color=red] 用文本制定要查找的字符串[/color]
新建一个string.txt,内容如下(这个文本中指定findstr要查找的字符串):[code]^hello
world
[/code].
a.txt[code]^hello
hello
hello hello
good hello
你好 hello
Hello World
Hello Boy
hello ,good man.
goodbye![/code]代码:[code]C:\Users\helloworld\Desktop>findstr /ig:string.txt a.txt[/code]效果:[code]hello
hello hello
Hello World
Hello Boy
hello ,good man.[/code].
被忽略的行[code]^hello
good hello
你好 hello
goodbye![/code].
[quote]从被忽略的“^hello”可以看出,在不加/l参数的前提下,用/g指定的搜索字符串中如果含有“元字符”,则作为正则表达式使用,而不是作为普通表达式。[/quote]
10.搜索一个完全匹配的句子
其实findstr自带的帮助中就有个很好的例子:
[quote]例如: 'FINDSTR "hello there" x.y' 在文件 x.y 中寻找 "hello" 或
"there"。'FINDSTR /C:"hello there" x.y' 文件 x.y 寻找
"hello there"。[/quote]
可以以这个例子来做个测试。
a.txt[code]hello there
hellothere
hello
there[/code].
代码:[code]C:\Users\helloworld\Desktop>findstr /ic:"hello there" a.txt[/code]结果:[code]hello there[/code]这就是句子的完全匹配了。
11.搜索一个完全匹配的词。
这里也涉及到了两个元字符:\<,\>。
先试看一个例子。
a.txt[code]far there
farthere
there
far
farm
farmer[/code].
代码:[code]C:\Users\helloworld\Desktop>findstr "far" a.txt[/code]结果:[code]far there
farthere
far
farm
farmer[/code].
我的本意是要查找含有“far”这个单词的行,但是farthere、farm、farmer却显示出来了,这不是我想要的结果。
[color=Red]如果只要求显示含有“far”这个单词的行,该怎么写呢?[/color]
代码:[code]C:\Users\helloworld\Desktop>findstr "\<far\>" a.txt[/code]结果:[code]far there
far[/code].
12.指定要查找的目录
[quote]/d参数我一直把它和/f、/g归为一类,但其实二者截然不同,/f、/g是用文本文件制定要查找的文件、字符串,而/d是直接书写目录名到命令中。[/quote]
代码:[code]C:\Users\helloworld\Desktop>findstr /imd:520;编程; ".*" "*.txt"[/code]结果:[code] 520:
hello.txt
编程:
help.txt
win7 help比xp help多出来的命令.txt
wmic.txt[/code]查找在520、编程目录中所有包含任意字符的txt文件。
13.统计字符数
/o:在每行前打印字符偏移量,在找到的每行前打印该行首距离文件开头的位置,也就是多少个字符,如test.txt中有如下内容:[code]aaaaaaaaaa
aaaaaaaaaa
aaaaaaaaaa
aaaaaaaaaa
aaaaaaaaaa
aaaaaaaaaa[/code]执行命令:[code]findstr /o .* test.txt[/code]::上一行中的.*为正则表达式的内容,表示任意行,包含空行
结果如下:[code]0:aaaaaaaaaa
12:aaaaaaaaaa
24:aaaaaaaaaa
36:aaaaaaaaaa
48:aaaaaaaaaa[/code]注意每行末尾的回车换行符算两个字符。
14.以指定颜色显示文件名
/a:当被搜索文件名中含有通配符*或?时对搜索结果的文件名部分指定颜色属性,具体颜色值参见color帮助:
0 = 黑色 8 = 灰色
1 = 蓝色 9 = 淡蓝色
2 = 绿色 A = 淡绿色
3 = 浅绿色 B = 淡浅绿色
4 = 红色 C = 淡红色
5 = 紫色 D = 淡紫色
6 = 黄色 E = 淡黄色
7 = 白色 F = 亮白色
常用于彩色显示,举个简单的例子,想要彩色显示“批处理之家”怎么办,假如当前的color设置为27(背景绿色,字体白色),用蓝色显示“批处理之家”咋办?::下一行的退格符可以在cmd的编辑模式下按ctrl+p后按退格键获得[code]>"批处理之家" set /p=<nul
findstr /a:21 .* "批处理之家*"
pause[/code]代码中的退格符是为了让显示的内容仅为"批处理之家",如果有其他内容,在彩色显示的"批处理之家"后还有一个冒号和其他内容,退格符正好将冒号删除。注意代码中的通配符是必须的。
15.findstr中的元字符
[attach]6887[/attach]
16.未讲解的内容:/p,/off[line]
这两个命令不明白是什么意思,因为不知道什么是“不可打印字符”、“带有脱机属性集的文件”,望有识之士给予解答。
[color=Green]扩展阅读:[/color]
1.什么是正则表达式:[url]http://zh.wikipedia.org/zh/%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F[/url]
2.正则表达式30分钟入门教程(非常好的教程,极力推荐):[url]http://deerchao.net/tutorials/regex/regex.htm[/url] 大工程... /L Uses search strings [color=Blue]literally[/color].
/R Uses search strings as [color=Blue]regular[/color] expressions.
/X Prints lines that match [color=Blue]exactly[/color]. 好文,顶一个! 非常棒,好好学习。 [i=s] 本帖最后由 doupip 于 2011-12-23 10:31 编辑 [/i]
楼主辛苦~[code]/v,未知;[/code]/v参数也是一个通用项.英文表达是[color=Red]invert[/color]-match 即反选,反转匹配模式 =select non-matching
在linux中的许多命令中也适用,只不过linux中是严格区分大小分,此参数用的是-V[code]/c,case,意为“把几个字加起来”;引申为“全部字匹配”;[/code]/c:string Uses specified string as a literal search string. 如果要用英文单词来帮助记忆的话,我觉得是[color=Red]character [/color]string更合适. 我来学习的同时,把我摸索出的一点 /r 应用说一下 :
看到/c 参数 很容易知道——如果希望查找匹配项是含空格的一串字符,而不是分别匹配空格分隔的多项,可以加/c: 如[code]echo a bc|findstr/c:"a bc"[/code]可是必须空格数也要准确一致,如果希望能匹配字符串中含不定数目的空格呢?/r 就发挥作用了[code]echo a bc|findstr/rc:"a\ *b"[/code] 其他的不是很难,关键是正则表达式这里最好多点例子。 [b]回复 [url=http://bbs.bathome.net/redirect.php?goto=findpost&pid=99416&ptid=14682]7#[/url] [i]yyykkkyyyy[/i] [/b][code]echo a bc|findstr/rc:"a\ *b"[/code]这个确实是意料之外的,那本《正则表达式入门经典》信誓旦旦的说“即使不指定/r,这也是默认行为”——其它测试这个说法是没问题的,但在空格这点上确实加了/r才会有结果。
莫非猫腻在“\”这个特殊的转义符? 我明白了!不在于“\”这个符号,“即使不指定/r,这也是默认行为”也没有错,关键是/c的特性——将字符链接起来,有去正则表达式的效果。
证明:
Findstr ".*" 1.txt
显示所有1.txt中的内容
Findstr /c:".*" 1.txt
什么也不显示,因为1.txt中没有包含“.*”的项。 [b]回复 [url=http://www.bathome.net/redirect.php?goto=findpost&pid=99842&ptid=14682]8#[/url] [i]cjiabing[/i] [/b]
正则表达式简介
[url]http://www.bathome.net/thread-4485-1-1.html[/url]
批处理findstr命令正则表达式的基本用法
[url]http://www.bathome.net/thread-24-1-1.html[/url] 在处理一些字符(比如有时候是中文,没有总结)时,用findstr /r 或findstr /l 试试。 感谢出了续集,学习下 支持了,我很久到这里看看了。 find "\<XXX\>" xxx.txt查找字符串的时候会将特殊字符(非字母数字)视为合法,如xx.txt内容为:
hello&%$+
hello world
helloworld
执行命令:findstr /i "\<hello\>" 123.txt
结果为:
hello&%$+
hello world
感觉这两个元字符确实有些不足呀! 统计的偏移量是包含结果中统计值所占的偏移量的,如第一行其实没有字符,结果为0:,占了两个偏移量,第二行有个空格, 结果中第二行占了三个偏移量,所以第三行统计的偏移量为2+3等于5
不知道这样理解正解否? 支持了,学习下 强悍啊 学习学习 findstr是不是对正则表达式的支持不完全啊,有些元字符貌似不支持啊? [b]回复 [url=http://bbs.bathome.net/redirect.php?goto=findpost&pid=99416&ptid=14682]7#[/url] [i]yyykkkyyyy[/i] [/b]
是不是可以这么说,在使用/f,/c,/d等参数时,会屏蔽掉字符串的正则性,必须显示声明正则才可以使用正则表达式进行搜索 这符号,看的眼睛都花了, 看着很乱 得仔细消化才行。 [i=s] 本帖最后由 shelluserwlb 于 2014-11-2 00:28 编辑 [/i]
[b]回复 [url=http://bbs.bathome.net/redirect.php?goto=findpost&pid=126695&ptid=14682]17#[/url] [i]baihaijiao101[/i] [/b]
我认为它指的是某一行的首字符相对于第1行首字符的偏移量 ,除第1行首字符偏移量是0外,
其它行数的首字符偏移量=上一行首字符偏移量+上一行字符数(含空格)+2(回车符和换行符)
例如: ---- test1.txt --------
aaaaaa aaaa
aaaa aaaaaa
aaaaaaaa aa
aaaaaaaaaa
--------------------------------
执行命令: findstr /o .* test1.txt
显示结果是:
0: aaaaaa aaaa
16:aaaa aaaaaa
30:aaaaaaaa aa
44:aaaaaaaaaa 加上正则立马就复杂了好多,得好好消化消化 好好学习学习。。。。有点不太懂。。 我想在多个txt文件中,按照多个关键字查找,(就是说在这个文件中要同时有多个关键字,可以不连续,a关键字在第一行,b关键字在第10行),从出现第一个关键字后,如果遇到空白行就停止。只有从第一个关键字到最后一个关键字都出现,而且中间没有空行,才符合条件,输出文件名。这个怎么实现啊?也不知我表达清楚没? [b]回复 [url=http://www.bathome.net/redirect.php?goto=findpost&pid=168134&ptid=14682]27#[/url] [i]duofangpao[/i] [/b]
提问请发到讨论版快 o 为 order,排序。 [quote]我来学习的同时,把我摸索出的一点 /r 应用说一下 :
看到/c 参数 很容易知道——如果希望查找匹配项是含空 ...
[size=2][color=#999999]yyykkkyyyy 发表于 2011-12-24 23:02[/color] [url=http://bbs.bathome.net/redirect.php?goto=findpost&pid=99416&ptid=14682][img]http://bbs.bathome.net/images/common/back.gif[/img][/url][/size][/quote][code] echo "abbc" | findstr /rc:"ab*c"[/code]这样也可以,看来并不是非要特殊的空格符 那个教程说30分钟就能看完,我从下午6点看到晚上10点,让我一度怀疑人生,emmmm
页:
[1]
2