找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 47981|回复: 24

[问题求助] PowerShell怎样根据区域字段重复去重复行?

[复制链接]
发表于 2023-8-1 09:30:58 | 显示全部楼层 |阅读模式
本帖最后由 娜美 于 2023-8-3 14:46 编辑

Get-Content 1.txt | sort -Unique -k4  -k5 | sc  2.txt
根据区域字段重复,去重复行, 这样写似乎不对, 请帮忙指正一下

  1. 1 2 3 4
  2. 1 2 3 4 5
  3. 1 2 4 0
复制代码
8/3 14:33补充
根据列数的字段是否为重复   空格为分隔符 例如如果第3 and 4列字段重复了  只要其中任意一行就行
out.txt
1 2 3 4 5
1 2 4 0
发表于 2023-8-1 09:43:30 | 显示全部楼层
回复 1# 娜美


    操作之前是怎样的,操作之后变成啥样?
 楼主| 发表于 2023-8-1 12:24:23 | 显示全部楼层
回复 2# Batcher


    应该是这样吧
out.txt
1 2 3 4 5
1 2 4 0
发表于 2023-8-3 12:52:31 | 显示全部楼层
本帖最后由 Nsqs 于 2023-8-3 13:00 编辑

不保留1234而保留12345吗?有没有规则之类的?

如果没有的话
  1. $text=
  2. '1 2 3 4
  3. 1 2 3 4 5
  4. 1 2 4 0'
  5. $str=$text -split '\r\n'
  6. $str|?{[regex]::Matches($text,$_).count -eq 1}
复制代码
发表于 2023-8-3 13:12:27 | 显示全部楼层
看不懂,你得说下
1 2 3 4
1 2 3 4 5
那里重复了,是如何重复的
(我只知道1 2 3 4 5去掉 5就是1 2 3 4)
 楼主| 发表于 2023-8-3 13:24:39 | 显示全部楼层
本帖最后由 娜美 于 2023-8-3 13:34 编辑

回复 5# Five66


    根据列数  例如第3 and 4列字段重复了
2 5 6 3 7
0 4 6 3 9
7 9 6 5 5
4 6 2 3 4

out.txt
0 4 6 3 9
7 9 6 5 5
4 6 2 3 4
 楼主| 发表于 2023-8-3 13:31:24 | 显示全部楼层
回复 4# Nsqs


    嗯结果是对, 但不过为什么要比awk写得更复杂呢, awk '!a[$3,$4]++'   就不能写出比awk更简化的吗
发表于 2023-8-3 13:35:59 | 显示全部楼层
回复 7# 娜美


    你要觉得awk好,那你就用awk啊,这是PowerShell
发表于 2023-8-3 13:42:52 | 显示全部楼层
  1.     $text=
  2.     '1 2 3 4
  3.     1 2 3 4 5
  4.     1 2 4 0'
  5. $text -split '\r\n'|?{[regex]::Matches($text,$_).count -eq 1}
复制代码
另外你要是觉得你有最优解,你可以自己自给自足,在PowerShell区发帖的目的是什么?学习?想学PowerShell,态度就这样?你是哪里觉得代码很复杂?这核心就一句话解决的事,你自己看一下你一楼自己写的是什么玩意?牛头不对马嘴,就这样吧,PowerShell不适合你.这么怕麻烦的话
发表于 2023-8-3 13:52:55 | 显示全部楼层
回复 7# 娜美


    假如一个功能需要10万行代码来实现,你把10万行封装成一个dll,其他程序来调用,一行代码就解决了。
你觉得这个用一行代码就叫简洁吗?
 楼主| 发表于 2023-8-3 14:32:17 | 显示全部楼层
本帖最后由 娜美 于 2023-8-3 14:45 编辑

回复 9# Nsqs


   好 好 好  好哥哥  不需要过度紧张嘛   如果1楼不够清楚, 不能理解透彻     那我补充一下
发表于 2023-8-3 14:48:27 | 显示全部楼层
假设第三列都存在,根据第三列去重并排序(去重时仅保留最先读取的那一行)
[code]
Get-Content 1.txt | sort  -unique {$_.split(' ')[2]} | sc  2.txt
[code]
$_.split(' ')[2]就是第三列,需要多列时加几个数字拼接一下其他列就行了(去重时仅保留最先读取的那一行,而且结果还会排序)
发表于 2023-8-3 14:50:02 | 显示全部楼层
回复 4# Nsqs


    还别说,虽然你的结果‘碰巧’对了(因一楼随手复制粘贴的东本不能体现出真实问题),
但与一楼的要求有出入,一楼是按照 第4列和第5列来判断(一楼的脚本虽然不正确,但意思应该是这个意思)是否已出现过,你的解法是按照整行判断的。
再修改一下就可以了。
 楼主| 发表于 2023-8-3 16:09:10 | 显示全部楼层
本帖最后由 娜美 于 2023-8-3 16:19 编辑

回复 12# Five66


    哥哥你这个理解能力就很好嘛, 但为什么这样就不行了呢
Get-Content 1.txt | sort  -unique {$_.split(' ')[1,2]} | sc  2.txt
  1. 1   2    3

  2. 1   2    3

  3. 1   0    3
复制代码
发表于 2023-8-3 17:34:02 | 显示全部楼层
回复 14# 娜美
$_.split(' ')是按单个空格切分每一行,不是单个空格的就换成其他的字符串
$_.split(' ')[1,2]结果是个数组,数组之间有特有的排序规则(也可能没有),总之将其转成字符串就比较好让人理解了

  1. Get-Content 1.txt | sort  -unique {$_.split(' ')[1,2] -join ''} | sc  2.txt
复制代码
去重时仅保留最先读取的那一行,而且结果还会排序
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-17 03:14 , Processed in 0.021025 second(s), 8 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表