Board logo

标题: [问题求助] 求PowerShell同时匹配多种情况的正则 [打印本页]

作者: 小白龙    时间: 2023-3-10 20:08     标题: 求PowerShell同时匹配多种情况的正则

3$_yui 小红花
2wer_iop 大花轿 azc
8_iop 中国龙

我想把上面的红色字用一个正则匹配出来, 总是搞不全, 求高手支招, 谢谢

规律:
开头是一个数字, 其后可能空或者是$或者是wer, 接着是_ 然后是多个字符, 接着是一个空格 然后是红色字, 后面, 可能没有字符了, 还可能有一个空格, 空格后有字符

下面是我写的, 匹配不全
"\d[\$|wer]*_.+? (.+?) .+"
作者: Five66    时间: 2023-3-10 20:38

匹配不需要的,剩下的就是需要的
  1. [^ -~\r\n]+
复制代码

作者: 小白龙    时间: 2023-3-10 21:01

回复 2# Five66

多谢大佬

没看懂, 常规的正则式应该怎么写
作者: Five66    时间: 2023-3-10 21:28

  1. \d[$wer]*_\S+ (\S)+ ?.*
复制代码

作者: Five66    时间: 2023-3-10 21:31

回复 4# Five66
用英文单引号引起来
作者: pd1    时间: 2023-3-10 21:35

匹配汉字?
[\u4e00-\u9fa5]+
作者: 小白龙    时间: 2023-3-10 22:06

回复 5# Five66


    多谢, 我执行后为什么只能返回一个中文字?

$s='3$_yui 小红花'
$s -match '\d[$wer]*_\S+ (\S)+ ?.*'
$matches
True

Name                           Value                                                                                 
----                           -----                                                                                 
1                              花                                                                                    
0                              3$_yui 小红花
作者: 小白龙    时间: 2023-3-10 22:07

回复 5# Five66


  用我这个也不行

\d[\$wer]*?_.+? (.+?) ?.*
作者: 小白龙    时间: 2023-3-10 22:09

回复 6# pd1

不只汉字, 任意字符,  但很规律
作者: 小白龙    时间: 2023-3-10 22:11

本帖最后由 小白龙 于 2023-3-10 22:13 编辑

回复 4# Five66

不好意思, 忘了提一点,
规律中提到: 数字后有$或wer或无   就这三种固定情况, 不是任一字符
作者: 小白龙    时间: 2023-3-10 22:27

回复 5# Five66

用 \d[$wer]*_.+? (.+)? ?.*
输出了后面的 aaa 为什么? 但是括号里没有包含 aaa

PS C:\Users\Administrator>
$s='3$_yui 小花猫 aaa'
$s -match '\d[$wer]*_.+? (.+)? ?.*'
$matches
True

Name                           Value                                                                                 
----                           -----                                                                                 
1                              小花猫 aaa                                                                              
0                              3$_yui 小花猫 aaa
作者: 小白龙    时间: 2023-3-10 22:36

用上面的正则可以适应另两种情况, 就是有上面的问题, 总是把空格后的内容匹配进去, 怪了, 求路过大佬
作者: xczxczxcz    时间: 2023-3-10 22:47

不明白 .* .+ .*? .*? 的匹配过程就尽量不要用,估计大部分被网上垃圾文章忽悠成?为尽可能少匹配|匹配 0个或1个(包括微软的狗屎文档)。
?号的真实意图为 回溯的方向。(不传之密)
若明白了1个?的回溯次数。你就可以任意写正则了。
  1. [regex]::Matches($t, "(?m)(?<=\d[^\s]*\s+)\b[^\s]*\b").value;
复制代码

作者: 小白龙    时间: 2023-3-10 23:30

回复 13# xczxczxcz

多谢大佬,

我把前在的(?m)删除掉, 无论是处理单行还是多行文本, 仍然有效
作者: 小白龙    时间: 2023-3-10 23:37

回复 13# xczxczxcz


    大佬 有推荐的文章吗? 您说的太高深了, 我搞混了, 不明白什么叫回溯, 上面的正则, 似懂非懂
作者: Five66    时间: 2023-3-11 00:21

回复 7# 小白龙
啊,搞错了,括号捕获位置换下, (\S)+换成(\S+)
  1. '\d[$wer]*_\S+ (\S+) ?.*'
复制代码

作者: 小白龙    时间: 2023-3-11 10:05

回复 16# Five66


    这回可以了, 但是还是有问题
[$wer]
这是指包含任一里面的字符, 而我的情况是三种
一:
$
二:
wer
三:


上面正则, 会把4$wer_ 开头的也匹配了
应该是匹配下面三种情况
4$_
4wer_
4_
作者: idwma    时间: 2023-3-11 16:38

推荐一个在线测试工具,可以自动拆分讲解
https://regexr.com/
作者: 小白龙    时间: 2023-3-11 16:55

回复 18# idwma

多谢大佬,

全英文的, 不知道怎么用
作者: Five66    时间: 2023-3-11 17:10

回复 17# 小白龙

不是很懂你的匹配目的
[$wer]后面不是有个*号?
*号是匹配0次或多次
匹配0次不就相当于第三种情况的无
匹配1次相对于第一种情况$
匹配3次相当于第二种情况wer
非要严格分三种情况就用
(_|$|wer)
然后去掉原来后面的*_符号,不过这样多了个分组
作者: idwma    时间: 2023-3-11 18:00

回复 19# 小白龙


    https://regexr-cn.com/
作者: WHY    时间: 2023-3-11 20:31

本帖最后由 WHY 于 2023-3-11 20:52 编辑
  1. $s = @'
  2. 3$_yui 小红花
  3. 2wer_iop 大花轿 azc
  4. 8_iop 中国龙
  5. '@
  6. [regex]::Matches($s, '(?im)(?<=^[0-9](?:\$|wer)?_\S+ )\S+').Value
  7. $s.Split("`r`n") -match '^[0-9](?:\$|wer)?_\S+\s\S+' | %{$_.Split()[1]}
复制代码





欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2