Board logo

标题: [转贴] 批处理命令findstr正则表达式的基本用法 [打印本页]

作者: youxi01    时间: 2007-10-27 17:30     标题: 批处理命令findstr正则表达式的基本用法

由联盟论坛9527整理
  1. 1.findstr . 2.txt 或 Findstr "." 2.txt  
  2. 从文件2.txt中查找任意字符,不包括空字符或空行
  3. ====================
  4. 2.findstr .* 2.txt 或 findstr ".*" 2.txt
  5. 从文件2.txt中查找任意字符包括空行和空字符
  6. ====================
  7. 3.findstr "[0-9]" 2.txt
  8. 从文件2.txt中查找包括数字0-9的字符串或行
  9. ====================
  10. 4.findstr "[a-zA-Z]" 2.txt
  11. 从文件2.txt中查找包括任意字符的字符串或行
  12. ====================
  13. 5.findstr "[abcezy]" 2.txt
  14. 从文件2.txt中查找包括a b c e z y字母的字符串或行
  15. ====================
  16. 6.findstr "[a-fl-z]" 2.txt
  17. 从文件2.txt中查找小写字符a-f l-z的字符串,但不包含g h I j k这几个字母。
  18. ====================
  19. 7.findstr "M[abc][hig]Y" 2.txt
  20. 从文件2.txt中可以匹配 MahY , MbiY, MahY等…..
  21. ====================
  22. 8. ^和$符号的应用
  23. ^ 表示行首,"^step"仅匹配 "step hello world"中的第一个单词
  24. $ 表示行尾,"step$"仅匹配 "hello world step"中最后一个单词
  25. ====================
  26. 9.findstr "[^0-9]" 2.txt
  27. 如果是纯数字的字符串或者行便过滤掉,例如2323423423 这样的字符串,如果是345hh888这样的形式就不成了。
  28. ====================
  29. 10.findstr "[^a-z]" 2.txt
  30. 同上,如果是纯字母的字符串或者行便过滤掉,例如 sdlfjlkjlksjdklfjlskdf这样的字符,如果是sdfksjdkf99999这样的形式,掺杂着数字就不成了
  31. ====================
  32. 11.*号的作用
  33. 前面已经说过了 ".*"表示搜索的条件是任意字符,*号在正则表达式中的作用不是任何字符,而是表示左侧字符或者表达式的重复次数,*号表示重复的次数为零次或者多次。
  34. ====================
  35. 12.findstr "^[0-9]*$" 2.txt
  36. 这个是匹配找到的纯数字,例如 234234234234,如果是2133234kkjl234就被过滤掉了。
  37.    Findstr "^[a-z]*$" 2.txt
  38. 这个是匹配找到的纯字母,例如 sdfsdfsdfsdf,如果是213sldjfkljsdlk就被过滤掉了
  39. 如果在搜索条件里没有*号,也就是说不重复左侧的搜索条件,也就是[0-9] [a-z]那只能匹配字符串的第一个字符也只有这一个字符,因为有行首和行尾的限制,"^[0-9]$"第一个字符如果是数字就匹配,如果不是就过滤掉,如果字符串是 9 就匹配,如果是98或者9j之类的就不可以了。
  40. =====================
  41. 13. "\<…\>"这个表达式的作用
  42. 这个表示精确查找一个字符串,\<sss 表示字的开始位置,sss\>表示字的结束位置
  43. echo hello world computer|findstr "\<computer\>"这样的形式
  44. echo hello worldcomputer|findstr "\<computer\>" 这样的形式就不成了,他要找的是 "computer"这个字符串,所以不可以。
  45. echo hello worldcomputer|findstr ".*computer\>"这样就可以匹配了
复制代码
【补充】
上文提到 . 作为元字符,可以用来匹配任意单个字符,比如:
  1. findstr "2.1" test.txt
复制代码
可以匹配到:
2.1
201
2a1
等等,包含这些字符串的行。

但是在某些场景下,我们希望 . 作为一个普通的字符,比如匹配某个版本号:
  1. findstr "2\.1" test.txt
复制代码
可以在 . 前面加一个转义符号 \ 来实现这个效果,只匹配 2.1 这个版本号,过滤掉201、2a1等不符合要求的行。

扩展阅读:批处理常用符号详解
http://bbs.bathome.net/thread-1205-1-1.html#pid25363

【实例补充】
匹配以张三李四开头的行:
  1. findstr "^张三 ^李四" "1.txt" > "2.txt"
复制代码
删除所有以#开头,并且有且只有一个#的行:
http://bbs.bathome.net/thread-59458-1-1.html
  1. findstr /b /e /v "#[^#]*" 1.txt
复制代码

作者: somebody    时间: 2007-10-29 03:29

呵呵``这个倒是有点用处..........收获了一点点..
作者: novaa    时间: 2007-10-29 12:10     标题: 看不太懂


作者: novaa    时间: 2007-11-16 19:02

现在回来看就好多了
呵呵
感觉进步了
这个findstr用处很广啊
哪天搜集下这方面的资料
作者: anrui    时间: 2007-12-23 23:46

这个站点是后起之秀,很多老的批处理站点,都是转载一些特别深奥的,一般人看不懂的东西,并且都是没有解释的,强烈支持本站点
作者: h0037126    时间: 2008-4-1 09:44

支持,看不太懂,但是学习了!
作者: 47478220    时间: 2008-4-1 10:22

<P>不错啊,原来bat还有正则表达式啊,长知识了,顶一下。呵呵。受益匪浅,建议不懂正则表达式的可以先学习一下js的正则表达式,然后再看这个应该比较容易理解。</P>
作者: freshlin    时间: 2008-6-19 16:48     标题: js的正则表达式和这一样吗

感觉好像还是有差别的
作者: freshlin    时间: 2008-6-19 17:49

我在a.txt中输入一个字符1,然后不回车换行。保存。
用findstr "^[0-9]*$"就搜不到这个1。

如果在字符1后回车换行,就能搜到这个1。

请问是怎么回事?
作者: kennybao    时间: 2008-11-15 21:29

这个没示例代码,* 用法比较难以理解,建议那位版主做个 示例代码。就像变量截取点点通 的那个很不错。
作者: sjminh    时间: 2009-7-21 18:42

不错,就是说的有点不太明确,希望可以改进
作者: Batcher    时间: 2009-7-21 20:14     标题: 回复 11楼 的帖子

哪里不明确?你希望哪里得到改进?
作者: lxzzr    时间: 2009-7-21 22:01

管理员:

9.finstr "[^0-9]" 2.txt

改下,呵呵^_^
作者: Batcher    时间: 2009-7-21 22:23     标题: 回复 13楼 的帖子

我帮楼主修改了,可能是9527兄在CN-DOS发帖时就有这个笔误,呵呵。
作者: nopr    时间: 2009-8-5 15:49

好像find都没什么用了哦,,
作者: Batcher    时间: 2009-8-5 16:48     标题: 回复 15楼 的帖子

统计文本行数的时候,用find命令更加简洁。
作者: wwenyunkui    时间: 2009-8-5 17:54

这个看来还真是有些不懂,基础比较差
作者: aiguozhe    时间: 2010-1-30 23:18

支持一下,看了还要回运用
作者: a590687    时间: 2010-1-31 07:40

谢谢. 基础的东西太重要了.精品.
作者: a590687    时间: 2010-1-31 17:03

这两个命令为什么都可以输出空格?
  1. 1.findstr . 2.txt 或 Findstr "." 2.txt  
  2. 从文件2.txt中查找任意字符,不包括空字符或空行
  3. ====================
  4. 2.findstr .* 2.txt 或 findstr ".*" 2.txt
  5. 从文件2.txt中查找任意字符包括空行和空字符
  6. ====================
复制代码

作者: aiguozhe    时间: 2010-1-31 17:33

完全看懂呢,真是对亏群里的朋友帮忙
作者: Batcher    时间: 2010-2-1 19:51     标题: 回复 20楼 的帖子

因为空格也属于“任意字符”
作者: caimingbing    时间: 2010-3-31 15:00

这个东西真好啊!
谢谢楼主
作者: cjiabing    时间: 2010-10-22 00:09

这个看过N回了,不过很少用,见人家用得很好的!~
问一个:
怎么查找非数字和字母的?——从另外角度说查找汉字?
作者: fflpxc    时间: 2010-12-7 11:59

懂了一半,再好好参详
作者: xslxslxsl    时间: 2011-9-17 17:20

学习了,很不错哦
作者: 几维kiwi    时间: 2012-2-8 22:35

  1. // test2.txt
  2. ABCDEFG
  3. abcdefg
  4. E:\tmp>findstr "[a-z]" test2.txt
  5. ABCDEFG
  6. abcdefg
  7. E:\tmp>findstr "[A-Z]" test2.txt
  8. ABCDEFG
  9. abcdefg
复制代码
findstr "[a-z]" test2.txt 我的理解是搜索包含任意小写英文字母的行,但是为什么搜索出来全是大写的行也输出结果呢?谢谢!
作者: wangx    时间: 2013-9-17 17:46

总觉的findstr比find要好用,有时用find总查不出来,findstr却能查出来,不知道什么原因
作者: cjiabing    时间: 2013-9-17 21:35

回复 27# 几维kiwi


    参照 /I
作者: Batcher    时间: 2013-9-17 21:47

回复 28# wangx


    findstr支持正则,find不支持。
作者: sunny26cn    时间: 2013-9-30 11:36

这个挺不错收藏有用
作者: llto521    时间: 2014-10-17 10:04

find  搜索文件什么的还是比较好用的, findstr 对文件内容搜索比较强项。 个人理解不知是否准确。
作者: DAIC    时间: 2014-10-17 10:58

回复 32# llto521


    Windows里面的find和Linux里面那个find不一样,它和findstr类似都是只能搜索文件内容。
作者: fluent    时间: 2014-10-27 15:24

  1. findstr "((?:(?:25[0-5]|2[0-4]\d|((1\d{2})|([1-9]?\d)))\.){3}(?:25[0-5]|2[0-4]\d|((1\d{2})|([1-9]?\d))))" 1.txt
复制代码
我想问下为何出不来。。。我想把文本里面所有IP地址提取出来。。有什么办法
作者: DAIC    时间: 2014-10-27 15:48

回复 34# fluent


    findstr命令不支持这种高级正则
作者: dst1213    时间: 2014-10-28 18:35

刚好在找这方面的资料,多谢了
作者: fatbird1942    时间: 2016-4-1 14:21

这个语句返回的是什么?
作者: re168    时间: 2016-7-2 00:15

谢楼主的分享!支持...
作者: ai20110304    时间: 2016-7-29 12:44

findstr这个命令字符串查找很强大,支持一部分正则表达式
作者: luke2    时间: 2016-7-29 21:06

如何实现执行bat文件后,生成的和所在的文件夹名字相同的CSV文件。
作者: oichen    时间: 2017-2-14 22:33

@echo off
color 0a
for /f %%a in ('type %cd%\file\c.txt^|findstr "\<.inf\>"') do (echo %%a >>%cd%\findstr.inf.txt)
pause

为什么这样运行没有结果,换成".inf$"也是一样,连文本也没有生成。
但是如果用".inf\>"的话运行就完全正常,里面找出一堆含有inf的行。
是不是在windows10里"\<.inf\>"和".inf$"这两个功能没有了????
作者: ai20110304    时间: 2018-8-29 15:14

不知道批处理findstr能否支持贪婪匹配和惰性匹配不。。。。   还有很多正则表达式的字符能支持不。


对翻译微软的文档有点蛋疼。一般表达式听着就很别扭
作者: qixiaobin0715    时间: 2020-12-22 06:32

回复 1# youxi01
很好例子,受益匪浅。但第12条有个小小的问题,既然*号表示0到若干次重复前面的字符,某行不存在任何字符也能匹配,所以空行也能匹配。应当修改为:
findstr "^[0-9][0-9]*$"和findstr "^[a-z][a-z]*$"
这样就比较严谨了。
作者: hongxin    时间: 2021-8-24 08:48

回复 1# youxi01


    好,学习了,感谢
作者: qixiaobin0715    时间: 2021-8-24 09:06

楼主的第4条也可这样:findstr /i [a-z] 2.txt
作者: qixiaobin0715    时间: 2021-10-26 16:46

回复 45# qixiaobin0715
楼上多此一举,这样写本身就不区分大小写,就不需要参数/i了。这样即可:
  1. 第4条也可这样:findstr "[a-z]" 2.txt
复制代码

作者: lidongyang    时间: 2024-5-6 16:49

回复 1# youxi01
使用$匹配行尾,测试不成功!




欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2