PowerShell绑定的文本和键同步排序和修改

meixi · 发表于 2022-11-29 12:42:41

本帖最后由 meixi 于 2022-11-30 09:45 编辑

大家好!
下面这个功能我已经有相关的程序来实现了, 现在想使用Powershell代码也实现一下,
个人感觉应该可以通过有序哈希表键值加数组排序来实现, 但对于这个例子, 两重排序, 键与值同步修改, 水平有限!
下面的图片, 左侧是处理前的文本, 右侧黑框中是处理后的文本

要处理的内容整体分为三部分:

第①部分是 ---> 第1行: 总是以/开头, 其后的文本是随机的, 该行不参与处理, 永远不变
________________________________________________________________________________
第②部分是 ---> 第2行至第1个以#bub Bub开头的行之间的内容【即蓝框之前的内容】
这部分是所有要处理的键, 它们很有规律, 为了便于理解, 我把它分为 A B C 3个区【图中红框部分】:
A区【空格:之前的文本】可以是( 非# 非: ) 开头的任意文本或字符
------------------------------------------------------------
B区【空格:至空格;;之间, 即红框里的彩色文本】其中bub.Bub是固定的, 后面跟了个序号
这部分非常重要, 这里的序号可以看作是键的ID, 它是唯一的, 在示例中:
bub.Bub11和所有键下面的#bub Bub11开头的行是绑定的, 需要同步更新, 例如:
bub.Bub11若改成了bub.Bub2 则下面的#bub Bub11也需要相应地改成#bub Bub2
------------------------------------------------------------
C区【空格;;之后的文本】由序号+空格+文本组成
________________________________________________________________________________
第③部分是 ---> 第1个以#bub Bub开头的行及其以下的所有内容【即蓝框里的内容】
这部分与第②部分的键相关联, 在示例中:
键 ab :bub.Bub11 与 #bub Bub11开头的行相关联, 相绑定, 该行下面的文本相当于键的值

某个键与其对应的#bub Bub开头的行及其下值的对应关系, 在图片中用相同的颜色表现出来了
________________________________________________________________________________________________
★★★★★处理过程★★★★★
先对第②部分所有的键进行排序, 规则如下:

按照A区的字母从a-z排序
若遇到相同字母的, 则按C区的序号大小排序, 在示例中:
A区有两个ab键, 一个键C区的序号是1, 另一个键C区的序号是7, 则1的在上, 7的在下

★★★在上面排序的同时, C区的序号也相应的修改, 在示例中:
●对于两个ab键
排在第1位的ab键的C区的序号如果不是1则改为1
排在第2位的ab键的C区的序号如果不是2则改为2, 以此类推
●对于1个ac键和1个hc键
因为只有1个, 所以直接将C区的序号改为1

★★★在上面排序的同时, 把B区序号ID依次修改为1-1000, 在示例中:
键的序号ID原来是 10 11 18 65 经过上面的排序后, 应分别改成 1 2 3 4

★★★在上面排序的同时, 所有键下面的, 相对应的#bub Bub开头的行及其下的值也同步修改和排序:
注意:
所有【#bub Bub开头的行】其下的值【内部的空行、行前空白符】要原样保留
所有【#bub Bub开头的行】前面只保留一个空行
________________________________________________________________________________
最后修改每个键相对应的【#bub Bub开头的行的m字母】后面的内容
格式:
m ;;A区文本 + 制表符tab + C区的文本
________________________________________________________________________________
有个例外:
如果某个键没有匹配到与其相对应的【#bub Bub开头的行】, 在示例中: hc 键
则新建该行,在其下加文字: 我是新建的

$s = @'
/abc
ab :bub.Bub11 ;;7 我原是Bub11改为Bub2序号2
ab :bub.Bub10 ;;1 我原是Bub10改为Bub1序号1
ac :bub.Bub18 ;;2 我原是Bub18改为Bub3序号1
hc :bub.Bub65 ;;6 我原是Bub65改为Bub4序号1
#bub Bub10 m ;;7
我之前在Bub10
最后在Bub1
#bub Bub18 m ;;6
我之前在Bub18
#前面有一个空格,上面有空行
最后在Bub3
#bub Bub11 m ;;9
我之前在Bub11
#bub Bub前面没空格
最后在Bub2
'@
#Todo: 处理代码
<# 处理后的文本
/abc
ab :bub.Bub1 ;;1 我原是Bub10改为Bub1序号1
ab :bub.Bub2 ;;2 我原是Bub11改为Bub2序号2
ac :bub.Bub3 ;;1 我原是Bub18改为Bub3序号1
#bub Bub1 m ;;ab 1 我原是Bub10改为Bub1序号1
我之前在Bub10
最后在Bub1
#bub Bub2 m ;;ab 2 我原是Bub11改为Bub2序号2
我之前在Bub11
#bub Bub前面没空格
最后在Bub2
#bub Bub3 m ;;ac 1 我原是Bub18改为Bub3序号1
我之前在Bub18
#前面有一个空格,上面有空行
最后在Bub3
#bub Bub4 m ;;hc 1 我原是Bub65改为Bub4序号1
我是新建的
#>

复制代码

Five66 · 发表于 2022-11-29 20:31:22

描述问题时建议不要带入解决问题的思路，否则很容易影响问题的理解的，还有请使用具体示例，比如你问题里的那个文本里内容完全是就是干扰，还以为是以文本的内容来进行处理。
总之看了好久，才总算理解了，给你个思路吧：
①：读取文件内容放入变量
②：从文件内容变量中匹配提取需要排序的内容存放在数组中（即第二部分，“ XX :bub.BubYY ;;ZZ -----------”这种形式的）
③：从文件内容变量中匹配提取键与值并构建哈希表（非必需）
④：按数组内容中的字母（XX）部分，排序数组（第一遍）
⑤：按数组内容中的序号（ZZ）部分，排序数组（第二遍）
⑥：遍历数组，按数组序号修改数组内容的键（bub.BubYY）部分和序号（ZZ）部分，并写入文件（第一遍）
⑦：遍历数组，从数组内容中找到键部分（bub.BubYY），索引哈希表（或从文件内容匹配内容），修改内容后写入文件（第二遍）

meixi · 发表于 2022-11-29 20:42:08

回复 2# Five66

感谢建议,

感觉我描述的可能太详细了, 并没有带入解决问题的思路, 只是在开头提了一下, 使用哈希和数组
最后面的代码, 有需要处理的字符串变量和处理之后的结果, 方便输出后对照

idwma · 发表于 2022-11-30 18:06:11

$a=New-Object Collections.Specialized.OrderedDictionary
$h='/abc'
if($s -match "(?s)(?<=$h\s+).+?(?=\s+#)"){$c=$matches[0]}
$c -split '\n'|%{
if($_ -match '^(\S+)\s+:((\D+)(\d+))\s*;;\S*\s*([^\r\n]+)'){
$d=$matches
if($s -match "(?s)(?<=\r\n#$($d[2]) m ;;.*?\r\n).+?(?=\s*#bub Bub\d+ m ;;|\s*$)"){
$a[$d[1]]+=,@($d[3],$d[5],$matches[0],$d[4])
}else{$a[$d[1]]+=,@($d[3],$d[5],'我是新建的',$d[4])}
}
}
$a.Keys|%{
$e=$_
$a.$e|sort{[int]$_[3]}|%{
$j++
$f+=@("{0} :{1}{2} ;;{3} {4}" -f $e,$_[0],++$i,$j,$_[1])
$g+=@("#bub Bub$i m ;;$e`t$($_[1])`r`n$($_[2])")
}
$j=0
}
"$h`r`n$($f -join "`r`n")`r`n`r`n$($g -join "`r`n`r`n")"

复制代码

meixi · 发表于 2022-11-30 21:41:51

回复 4# idwma

多谢, 好像A区没有排序, 例如, 我把ac和hc交换一下, 输出后hc仍然在上

$s = @'
/abc
ab :bub.Bub11 ;;7 我原是Bub11改为Bub2序号2
ab :bub.Bub10 ;;1 我原是Bub10改为Bub1序号1
hc :bub.Bub65 ;;6 我原是Bub65改为Bub4序号1
ac :bub.Bub18 ;;2 我原是Bub18改为Bub3序号1
#bub Bub10 m ;;7
我之前在Bub10
最后在Bub1
#bub Bub18 m ;;6
我之前在Bub18
#前面有一个空格,上面有空行
最后在Bub3
#bub Bub11 m ;;9
我之前在Bub11
#bub Bub前面没空格
最后在Bub2
'@

复制代码

idwma · 发表于 2022-11-30 21:57:43

$a=@{}
$h='/abc'
if($s -match "(?s)(?<=$h\s+).+?(?=\s+#)"){$c=$matches[0]}
$c -split '\n'|%{
if($_ -match '^(\S+)\s+:((\D+)(\d+))\s*;;\S*\s*([^\r\n]+)'){
$d=$matches
if($s -match "(?s)(?<=\r\n#$($d[2]) m ;;.*?\r\n).+?(?=\s*#bub Bub\d+ m ;;|\s*$)"){
$a[$d[1]]+=,@($d[3],$d[5],$matches[0],$d[4])
}else{$a[$d[1]]+=,@($d[3],$d[5],'我是新建的',$d[4])}
}
}
$a.Keys|sort|%{
$e=$_
$a.$e|sort{[int]$_[3]}|%{
$j++
$f+=@("{0} :{1}{2} ;;{3} {4}" -f $e,$_[0],++$i,$j,$_[1])
$g+=@("#bub Bub$i m ;;$e`t$j $($_[1])`r`n$($_[2])")
}
$j=0
}
"$h`r`n$($f -join "`r`n")`r`n`r`n$($g -join "`r`n`r`n")"

复制代码

回复 5# meixi

meixi · 发表于 2022-12-1 10:10:02

多谢, 想请教几个问题

1.第一行这个可以免修改吗? 因为第一行是不需要动的, 不然每次都要手改一下
$h='/abc'

2. $a=@{} 我换成原来的$a=New-Object Collections.Specialized.OrderedDictionary也可以, 感觉用C#的这个, 应该快点

3.代码中类似 $x += @(xxx) 这种数组操作在字符多的时候, 处理的时间太长, 能换成C#的数组列表来处理吗

idwma · 发表于 2022-12-1 14:00:31

回复 7# meixi

2,3行改一下

if($s -match "(?s)(?<=^(?<h>/.*)\s+).+?(?=\s+#)"){$c=$matches[0];$h=$matches.h}

复制代码

C#数组是什么不会呀

5i365 · 发表于 2022-12-1 14:31:52

本帖最后由 5i365 于 2022-12-1 14:32 编辑

回复 8# idwma

C#数组就是这个 $t = New-Object System.Collections.ArrayList

https://blog.csdn.net/weixin_30734435/article/details/97778376

meixi · 发表于 2022-12-1 14:42:05

回复 9# 5i365

对, 就是这个

idwma · 发表于 2022-12-1 14:52:20

$a=@{}
if($s -match "(?s)(?<=^(?<h>/.*)\s+).+?(?=\s+#)"){$c=$matches[0];$h=$matches.h}
$c -split '\n'|%{
if($_ -match '^(\S+)\s+:((\D+)(\d+))\s*;;\S*\s*([^\r\n]+)'){
$d=$matches
if($s -match "(?s)(?<=\r\n#$($d[2]) m ;;.*?\r\n).+?(?=\s*#bub Bub\d+ m ;;|\s*$)"){
$a[$d[1]]+=,@($d[3],$d[5],$matches[0],$d[4])
}else{$a[$d[1]]+=,@($d[3],$d[5],'我是新建的',$d[4])}
}
}
$f = New-Object System.Collections.ArrayList
$g = New-Object System.Collections.ArrayList
$null=$a.Keys|sort|%{
$e=$_
$a.$e|sort{[int]$_[3]}|%{
$j++
$f.add(("{0} :{1}{2} ;;{3} {4}" -f $e,$_[0],++$i,$j,$_[1]))
$g.add("#bub Bub$i m ;;$e`t$j $($_[1])`r`n$($_[2])")
}
$j=0
}
"$h`r`n$($f -join "`r`n")`r`n`r`n$($g -join "`r`n`r`n")"

复制代码

meixi · 发表于 2022-12-1 14:57:27

回复 11# idwma

不比不知道, 这一改真是快了

		自动登录	找回密码
密码			注册

[新手上路]批处理新手入门导读	[视频教程]批处理基础视频教程	[视频教程]VBS基础视频教程	[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动	[批处理精品]CMD命令50条不能说的秘密	[在线下载]第三方命令行工具	[在线帮助]VBScript / JScript 在线参考

[问题求助] PowerShell绑定的文本和键同步排序和修改

评分

浏览过的版块