找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 80332|回复: 23

[文本处理] 批处理怎样删除组成元素相同的重复行?

[复制链接]
发表于 2011-9-2 11:55:59 | 显示全部楼层 |阅读模式
文本中有很多行,下面只是一部分,每行都是三列随机数字:
1 1 1
1 1 2
1 2 1
2 3 0
2 1 1
0 2 3
4 5 6

只要组成元素相同,就视为重复行。比如以下三行均视为重复行:
1 1 2
1 2 1
2 1 1
还有以下两行也是重复行:
2 3 0
0 2 3

对于重复行,任意保留中一行即可。对于非重复行,原样保留。
发表于 2011-9-2 12:44:28 | 显示全部楼层
来一个兼容性很差的...抛砖了哈:
  1. @echo off&setlocal enabledelayedexpansion
  2. for /f "delims=" %%a in (1.txt) do (
  3.    set /a n=0
  4.    for %%b in (%%a) do set /a "n+=1<<%%b"
  5.    if not defined _!n! echo %%a
  6.    set _!n!=_
  7. )
  8. pause
复制代码
 楼主| 发表于 2011-9-2 13:42:16 | 显示全部楼层
回复 2# CrLf


多谢版主
请问兼容性差是指什么?
 楼主| 发表于 2011-9-2 15:30:24 | 显示全部楼层
回复 4# else


多谢,看来2楼的代码不能用了,我的数据很重要,不能漏掉。
发表于 2011-9-2 18:05:36 | 显示全部楼层
来一个列排序版的,用的是比较简陋的排序方式,列数一多就蛋疼了...
  1. @echo off&setlocal enabledelayedexpansion
  2. for /f "tokens=1-3" %%a in (1.txt) do (
  3.         set /a a=%%a,b=%%b,c=%%c
  4.         for %%d in (c-b b-a c-b) do (
  5.                 for /f "tokens=1,2 delims=-" %%e in ("%%d") do (
  6.                         if !%%e! gtr !%%f! set /a %%e=!%%f!,%%f=!%%e!
  7.                 )
  8.         )
  9.         if not defined _!a!_!b!_!c! (
  10.                 echo %%a %%b %%c
  11.                 set _!a!_!b!_!c!=_
  12.         )
  13. )
  14. pause
复制代码
发表于 2011-9-2 18:30:06 | 显示全部楼层
来一个不那么蛋疼的,只要在 str 中给够足量的变量名,应可兼容任意列数:
  1. @echo off&setlocal enabledelayedexpansion
  2. set str=a b c
  3. ::abc 分别代表三个变量名,表示只有三列

  4. for %%a in (!str!) do (
  5.         for /f %%b in ("!str:*%%a=!") do (
  6.                 if defined list set "list=!list!%%a "
  7.                 set "list=%%a !list!"
  8.                 set list=!list:%%a =%%b-%%a !
  9.         )
  10. )
  11. ::获取用于 if 判断的顺序表

  12. for /f "delims=" %%a in (1.txt) do (
  13.         set tmp=%%a
  14.         for %%b in (%str%) do (
  15.                 for /f %%c in ("!tmp!") do set %%b=%%c
  16.                 set tmp=!tmp:~2!
  17.         )
  18.         rem 设置每列的值到对应变量

  19.         for %%d in (%list%) do (
  20.                 for /f "tokens=1,2 delims=-" %%b in ("%%d") do (
  21.                         if !%%b! gtr !%%c! set /a %%b=!%%c!,%%c=!%%b!
  22.                 )
  23.         )
  24.         if not defined _!a!_!b!_!c! (
  25.                 echo %%a
  26.                 set _!a!_!b!_!c!=_
  27.         )
  28. )
  29. pause
复制代码
发表于 2011-9-2 21:42:53 | 显示全部楼层
每一行元素相同且都是数字, 相同的数字之和相等,元素都必然相同
  1. @echo off
  2. setlocal enabledelayedexpansion
  3. for /f "tokens=1-3" %%a in (1.txt) do (
  4. set /a num=%%a+%%b+%%c
  5. for /f "tokens=1-4" %%i in ("!num! %%a %%b %%c") do (
  6. set /a _%%i+=1
  7. if "!_%%i!"=="1" echo %%j %%k %%l
  8. )
  9. )
  10. pause
复制代码
 楼主| 发表于 2011-9-2 22:23:45 | 显示全部楼层
回复 9# 545810831


1+2+3=2+2+2
发表于 2011-9-3 06:21:52 | 显示全部楼层
错了?解决不了问题
发表于 2011-9-5 11:21:37 | 显示全部楼层
一行各个元素平方和只有各个元素相同时才会相等,所以稍稍改一下代码即可,不知文本有多长,可能导致卡机?
发表于 2011-9-5 12:34:02 | 显示全部楼层
有想法,不过也是不严谨,3 0 0 与 2 2 1 平方和相同
发表于 2011-9-5 12:40:10 | 显示全部楼层
不过如果列数与指数相同,好像没想到有反例可以证明这种算法不严谨
发表于 2011-9-5 14:08:34 | 显示全部楼层
本着解决问题的思想,如果只是数字可以试试用Perl解决:

  1. #!/usr/bin/perl
  2. use warnings;
  3. use strict;

  4. my %count;
  5. while (<DATA>) {
  6. my @number=split;
  7. chomp (my $sorted_number=join "",sort { $a <=> $b } @number);
  8. $count{$sorted_number}++;
  9. print "$_" if $count{$sorted_number}==1;
  10. }
  11. __END__
  12. 1 1 1
  13. 1 1 2
  14. 1 2 1
  15. 2 3 0
  16. 2 1 1
  17. 0 2 3
  18. 5 4 6
  19. 4 5 6
  20. 7 8 9
  21. 8 7 9
  22. 1 1 1
复制代码
发表于 2011-9-5 16:35:14 | 显示全部楼层

  1. @echo off
  2. if exist temp1.txt (del /a /f temp1.txt)
  3. if exist temp2.txt (del /a /f temp2.txt)
  4. for /f "tokens=1-3" %%i in (1.txt) do (
  5.     (echo %%i&echo %%j&echo %%k)|sort
  6. )>>temp1.txt
  7. for /f "tokens=1,2 delims=:" %%i in ('findstr /n .* temp1.txt') do (
  8.     setlocal enabledelayedexpansion
  9.     set /a a=%%i%%3
  10.     if !a! equ 1 (echo.&&set /p=%%j<nul) else (set /p=%%j<nul)
  11. )>>temp2.txt
  12. del /a /f temp1.txt
  13. pause
复制代码
运行这个代码可以帮你转换成"去掉重复行",之后就好处理了
好久没写了,可能不给力
发表于 2011-9-5 17:05:04 | 显示全部楼层
另外怎么没人用冒泡排序啊,个人认为可以在FOR /F中用它来达到我16L的转换
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-18 04:48 , Processed in 0.021349 second(s), 8 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表