[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[问题求助] [已解决]PowerShell怎样删除大文件中的多余重复行?

本帖最后由 awk 于 2013-9-5 14:14 编辑

服务器上的数据文件,大概有三千多万行的数据。
对于重复出现的行,只保留第一次出现的就行了,把多余的删掉。

样例数据:
awk PowerShell-3
awk PowerShell-3
awk PowerShell-5
awk PowerShell-3
awk PowerShell-5
awk PowerShell-1
awk PowerShell-2

处理之后得到:
awk PowerShell-3
awk PowerShell-5
awk PowerShell-1
awk PowerShell-2

回复 2# PowerShell


看不懂C#,也不想学,因为我的工作中根本用不到。
文件太大了,十几个GB,不好传啊。
版主能否先给个针对小文件的PowerShell去重代码?我先学习一下。

TOP

回复 5# PowerShell


我记得冒泡,二叉遍历之类的好像是用来排序的吧,以前学校里面学过,现在都忘了。
如果说错了请大家指正。
去重之前必须要排序吗?好复杂的说。

TOP

回复 12# PowerShell


    我在顶楼放了点数据

TOP

回复 12# PowerShell


    版主最近忙什么呢?数据放在顶楼好几天了,求代码啊。

TOP

回复 17# luke


    正解。感谢!

TOP

返回列表