[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[问题求助] PowerShell怎样将csv中大致重复的项另存为新csv文件

如何用powershell将csv文件中大致重复的项另存为新csv文件,
例如下面的这个csv文件, 歌手和歌名并非完全重复

------------------------------------------------------------------------------
排序,语言,歌手,歌名
66,国语,安静,红颜知己
67,国语,韩可可,错位时空 (女版)
68,国语,于洋,望爱却步
75,国语,胡小斐,无药可愈
76,国语,en,嚣张
565,国语,韩可可(3),错位时空
566,国语,杜宣达,原来我从未忘记你
567,国语,悦开心,别想他
568,国语,新乐尘符,123我爱你

这个有解吗?  一点头绪也没有

TOP

本帖最后由 5i365 于 2022-1-7 13:44 编辑

回复 3# went


    感谢帮忙, 我现在想了一个逻辑,
如果歌手中有连续的三个字重复【即csv文件第三行】, 同时歌名中有连续的三个字重复【即csv文件第四行】, 此时就算满足条件, 最好有个变量, 我可以修改连续文字的数量
还有个可能的情况是,不只两行中的有重复的情况, 还有可能是三行或N行中有上面描述的重复情况

TOP

回复 6# xczxczxcz


    感谢分享, 执行后,生成的文件为空, 请问如何使用?

TOP

本帖最后由 5i365 于 2022-1-7 19:11 编辑

回复 5# went


    如果csv有1000条,不知是对比时间太漫长还是怎么一直不能结束, 然后我就手动关闭了,生成的结果中,还是有问题,相同的并没有上下显示在相邻行

TOP

本帖最后由 5i365 于 2022-1-8 09:51 编辑

回复 8# xczxczxcz


大侠, 侠气凛然, 着实让从人佩服!!!

在下不才,  昨晚真是试了很多次没有结果, 到头了没看懂你写的怎么用,

论坛本来就是个学习的地方, 但凡路过的坛友, 学习一翻你的代码, 更显你的豪气, 更多一份敬佩!!

但是刚才一找, 代码删了, 不见了, 那真就是在俺一个入门者面前耍一下大刀, 炫技了一翻, 没有任何意义

无论如何, 大侠能抽自己的时间和精力加入到处理这个论坛问题的队伍中来, 还是非常感谢的

不明白什么叫 禁止套娃, 百度了一下刚懂, 现在娃没有了, 是不是大家可以随便套了?

TOP

回复 9# went


    感谢回复, 已传, 大侠认真的态度让人钦佩, 宛若论坛中的一股清流!

TOP

回复 12# went


    感谢, 刚才试了一下, 得到下面的结果:

但有些项不应输出,例如;
795和534, 562和578, 851和501, 都是两首歌, 是同一歌手唱

前两组的输出是对的

感觉现在对比的逻辑是: 要先排除歌名中的括号中的内容后再对比

------------------------------------------------------
546,国语,Bomb比尔,0222心动-比尔的歌
407,国语,Bomb比尔,1022-比尔的歌
67,国语,韩可可,错位时空 (女版)
565,国语,韩可可(3),错位时空
795,粤语,亮声open,多年以后 (粤语版)
534,粤语,亮声open,无人与我 (粤语版)
562,国语,刘大壮,我很好 (吉他版)
578,国语,刘大壮,一吻天荒 (吉他版)
851,国语,杨冰心,红尘谁不是过客 (女版)
501,国语,杨冰心,学会爱自己 (女版)

TOP

返回列表