Rank: 3 Rank: 3

帖子: 150
积分: 214
技术: 0
捐助: 0
注册时间: 2011-2-28

1楼 跳转到 » 倒序看帖

字体大小: tT

发表于 2013-3-11 22:54 | 显示全部帖子

[文本处理] 如何提高批处理删除重复内容文本的效率？

多个文本内有重复的字符，我设定一旦有重复的，就将其所含内容的整个文本删除，但是效率非常低下，1000个txt文档，就需要好几分钟。而我这里有上万个，求高手能否改进？

@echo off&setlocal enabledelayedexpansion 
for %%a  in (*.txt) do (
    for /f "usebackq delims=. tokens=2,*" %%b in (%%a) do (
        set "str=%%b"
	set "str=!str: =!"
        for %%i in (!str!) do (
	set/a _%%i+=1
                if !_%%i! gtr 2 echo %%a>>1.txt  2>nul  
        )
    set _%%i=
    )
)
pause
复制代码

我这里写的是读入 1.txt

然后在读入的内容中发现

33303564545.txt
33303564545.txt
33303564545.txt
33303564545.txt
999999999999999.txt
999999999999999.txt
999999999999999.txt

以上是ECHO出来的，就是条件循环判断正确的，就其删除，但是会出现好几次，有上万个这样的文件，所以我想先写入一个文本，然后再根据文本上的地址删除，不知道有没有更加高效的方法，做到可以让删除的提示不出现那么多次，2>NUL 只是假象。。

意思就是换成 DEL 里面的路径文件，依旧效率不高，最好能只显示一次，然后一次性删除，不符合条件的文本。因为有上万个，希望能高效一点，求好心人解决！

运行是正常的，就是效率很低下。。

playinthesky

三级士官

Rank: 3 Rank: 3

帖子: 150
积分: 214
技术: 0
捐助: 0
注册时间: 2011-2-28

2楼

发表于 2013-3-11 23:13 | 显示全部帖子

通过在BATHOME的学习，慢慢的学会写代码，希望大家再帮帮我，自己顶一下。

TOP

playinthesky

三级士官

Rank: 3 Rank: 3

帖子: 150
积分: 214
技术: 0
捐助: 0
注册时间: 2011-2-28

3楼

发表于 2013-3-11 23:16 | 显示全部帖子

因为批处理每个都要历遍，但是为什么删除的时候，循环要检查好几次？

TOP

playinthesky

三级士官

Rank: 3 Rank: 3

帖子: 150
积分: 214
技术: 0
捐助: 0
注册时间: 2011-2-28

4楼

发表于 2013-3-11 23:35 | 显示全部帖子

回复 5# terse

我那个是有格式的，所以必须按照上面的那种分隔符来，我去试试看！最最主要上万个。。

TOP

playinthesky

三级士官

Rank: 3 Rank: 3

帖子: 150
积分: 214
技术: 0
捐助: 0
注册时间: 2011-2-28

5楼

发表于 2013-3-11 23:36 | 显示全部帖子

回复 5# terse

是加在最后？对么？试试看！

TOP

playinthesky

三级士官

Rank: 3 Rank: 3

帖子: 150
积分: 214
技术: 0
捐助: 0
注册时间: 2011-2-28

6楼

发表于 2013-3-11 23:56 | 显示全部帖子

回复 8# terse

超级高！！！非常快！！！谢谢高手，那我就是要那个文本文件改写成.BAT就可以吧？可不可以直接一点的。。

TOP

playinthesky

三级士官

Rank: 3 Rank: 3

帖子: 150
积分: 214
技术: 0
捐助: 0
注册时间: 2011-2-28

7楼

发表于 2013-3-11 23:59 | 显示全部帖子

本帖最后由 playinthesky 于 2013-3-12 00:07 编辑

回复 8# terse

我想加入计数器，在第二个FOR里面，重复内容5个以上的时候，删除文本，你的这个版本真心好！

TOP

playinthesky

三级士官

Rank: 3 Rank: 3

帖子: 150
积分: 214
技术: 0
捐助: 0
注册时间: 2011-2-28

8楼

发表于 2013-3-12 00:01 | 显示全部帖子

回复 10# CrLf

是纯批处理，可不可以加入一个计数器，等到重复到一定个数的时候删除？求教。

TOP

playinthesky

三级士官

Rank: 3 Rank: 3

帖子: 150
积分: 214
技术: 0
捐助: 0
注册时间: 2011-2-28

9楼

发表于 2013-3-12 00:03 | 显示全部帖子

回复 5# terse

高手，加个计数器，等到重复两个或者三个的时候，直接删除。谢谢

TOP

playinthesky

三级士官

Rank: 3 Rank: 3

帖子: 150
积分: 214
技术: 0
捐助: 0
注册时间: 2011-2-28

10楼

发表于 2013-3-12 00:05 | 显示全部帖子

回复 5# terse

重复的数量上有限定要求，加入计数器在哪里比较好？

TOP

playinthesky

三级士官

Rank: 3 Rank: 3

帖子: 150
积分: 214
技术: 0
捐助: 0
注册时间: 2011-2-28

11楼

发表于 2013-3-12 00:26 | 显示全部帖子

回复 15# CrLf

大哥，我的意思是在我最初写的代码里，GTR 3 或者 4 或者 5 可以吗？或者 LSS 也成，加个计数器，谢谢你！！你们的代码都很高深，我不知道如何插入？谢谢了。。我要计算重复大于5个的文件删除之类，可以实现吗？

TOP

playinthesky

三级士官

Rank: 3 Rank: 3

帖子: 150
积分: 214
技术: 0
捐助: 0
注册时间: 2011-2-28

12楼

发表于 2013-3-12 00:29 | 显示全部帖子

回复 15# CrLf

问题是有固定格式的。。对不起，已经很烦扰你了。。我需要用 . 作为分割，然后把空格消掉，所以才在顶楼这样写。。。谢谢。。

TOP

playinthesky

三级士官

Rank: 3 Rank: 3

帖子: 150
积分: 214
技术: 0
捐助: 0
注册时间: 2011-2-28

13楼

发表于 2013-3-12 01:01 | 显示全部帖子

本帖最后由 playinthesky 于 2013-3-12 06:08 编辑

回复 18# CrLf

重复次数，我理解的，我的意思是它那个文件上有格式方面的限制，比方说ABCDABCD，如果说重复的话，A不是出现了两次，但是我是一个数组，所有是ABC为一个组合出现，需要计数，所以用了TOKENS和DELIMS，

TOP

playinthesky

三级士官

Rank: 3 Rank: 3

帖子: 150
积分: 214
技术: 0
捐助: 0
注册时间: 2011-2-28

14楼

发表于 2013-3-12 01:05 | 显示全部帖子

本帖最后由 playinthesky 于 2013-3-12 06:07 编辑

回复 10# CrLf

TOP

返回列表

[新手上路]批处理新手入门导读	[视频教程]批处理基础视频教程	[视频教程]VBS基础视频教程	[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动	[批处理精品]CMD命令50条不能说的秘密	[在线下载]第三方命令行工具	[在线帮助]VBScript / JScript 在线参考

[文本处理] 如何提高批处理删除重复内容文本的效率？

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]