[文本处理] [讨论]批处理findstr和变量赋值法查找文本的结果和效率差异

Rank: 4

帖子: 57
积分: 328
技术: 0
捐助: 0
注册时间: 2009-4-20

35楼

发表于 2009-6-27 19:18 | 只看该作者

回复 34楼的帖子

其实我那俩文本里面有=的例子oriana=-du_7141@hotmail.com
现在去测试，确实两个都有的，它都生成到888里面去了

学海无涯

Rank: 8 Rank: 8

帖子: 1069
积分: 12123
技术: 38
捐助: 0
注册时间: 2008-5-10

34楼

发表于 2009-6-27 19:07 | 只看该作者

回复 33楼的帖子

LZ似乎忘了自己的问题。。。
假如888.txt中有a=b，而555.txt也有，那你的要求是不需要输出，而现在却输出了，这不就是问题吗？？

命令行参考：hh.exe ntcmds.chm::/ntcmds.htm
求助者请拿出诚心，别人才愿意奉献热心！
把查看手册形成条件反射！

Rank: 4

帖子: 57
积分: 328
技术: 0
捐助: 0
注册时间: 2009-4-20

33楼

发表于 2009-6-27 18:52 | 只看该作者

回复 32楼的帖子

最后结果显示 a=b
这是对还是不对？
呵呵，倒真是见识了batcher第三方工具的厉害。1秒钟搞定

学海无涯

Rank: 8 Rank: 8

帖子: 1069
积分: 12123
技术: 38
捐助: 0
注册时间: 2008-5-10

32楼

发表于 2009-6-27 18:30 | 只看该作者

点和星号在正则表达式中都有特殊意义。如果不加/L参数，会产生问题。

对于楼主的问题，无论是用findstr还是设置变量法，都不能很好的解决。最好是用第三方工具或其他方法。
findstr 的问题看看我8楼的回复并运行一下就知道。
至于设置变量法，如果文本中含有等号，也会出现问题。

echo a=b>1.txt
for /f "delims=" %%a in (1.txt) do set .%%a=1
for /f "delims=" %%a in (1.txt) do if not defined .%%a echo %%a
复制代码

此帖的方向转到关于效率的讨论倒是不错。

命令行参考：hh.exe ntcmds.chm::/ntcmds.htm
求助者请拿出诚心，别人才愿意奉献热心！
把查看手册形成条件反射！

Rank: 4

帖子: 57
积分: 328
技术: 0
捐助: 0
注册时间: 2009-4-20

31楼

发表于 2009-6-27 18:15 | 只看该作者

回复 5楼的帖子

测试结果显示，去掉p*[email].tournois@chello.fr[/email]中的星号，它一切都是正常的，但是去掉它中的点，保留星号，就出问题了，说明问题是在星号上，而不是你说的点上

学海无涯

随风

Rank: 8 Rank: 8

帖子: 1759
积分: 5387
技术: 51
捐助: 210
注册时间: 2007-10-26

30楼

发表于 2009-6-27 15:53 | 只看该作者

回复 24楼的帖子

!a[$1]++

百思不得其解，能解释下么？

技术问题请到论坛发帖求助！

tireless

少校

Rank: 6 Rank: 6

帖子: 381
积分: 1801
技术: 9
捐助: 0
注册时间: 2008-10-27

29楼

发表于 2009-6-27 15:32 | 只看该作者

用括号括起来进行输出确实是一行一行输出，可以这样验证：

@echo off
(
  echo a
  pause 打开 output.txt 会发现已经输出了 a 和 pause 的提示。
  echo b
) > output.txt
复制代码

Rank: 4

帖子: 57
积分: 328
技术: 0
捐助: 0
注册时间: 2009-4-20

28楼

发表于 2009-6-27 15:23 | 只看该作者

等下我重启机器不开任何东西，做0负荷的测试，就我原代码那个进行测试，原来的时间为37分39秒
测试完以后，我会上来发布测试结果，以真实数据来证明到底其他环境有多大影响

不好意思，大家久等了，我重启机器，所有的程序网页都没开，只是单纯测试我的原代码
测试的时间为 37分26秒

跟我想象的一样，只是差了13秒，从总体时间来考虑，也就是开其它程序，网页，或者bat对结果的影响是微小的！

[ 本帖最后由 jackerloo2009 于 2009-6-27 16:26 编辑 ]

学海无涯

Rank: 4

帖子: 57
积分: 328
技术: 0
捐助: 0
注册时间: 2009-4-20

27楼

发表于 2009-6-27 15:02 | 只看该作者

回复 25楼的帖子

我对于一直做这么多相同的测试，并不赞同你的观点，我个人感觉影响微小

学海无涯

Rank: 4

帖子: 57
积分: 328
技术: 0
捐助: 0
注册时间: 2009-4-20

26楼

发表于 2009-6-27 15:01 | 只看该作者

回复 24楼的帖子

还是第三方强大，1秒就ok了

学海无涯

Rank: 8 Rank: 8

帖子: 1069
积分: 12123
技术: 38
捐助: 0
注册时间: 2008-5-10

25楼

发表于 2009-6-27 15:01 | 只看该作者

做测试的同时干其他事情是有影响的。
如果你把bat窗口最小化了，或者正在操作对内存消耗大的程序，影响更大。系统会自动对后台运行的任务进行优化以节约内存。

命令行参考：hh.exe ntcmds.chm::/ntcmds.htm
求助者请拿出诚心，别人才愿意奉献热心！
把查看手册形成条件反射！

Batcher

管理员

Rank: 12

帖子: 14855
积分: 46051
技术: 854
捐助: 745
注册时间: 2008-6-9

24楼

发表于 2009-6-27 14:52 | 只看该作者

gawk "NR==FNR{a[$1]++}NR>FNR&&!a[$1]++" b.txt a.txt>c.txt
复制代码

第三方命令行工具 gawk.exe 下载地址：
http://bbs.bathome.net/thread-1114-1-1.html

我帮忙写的代码不需要付钱。如果一定要给，请在微信群或QQ群发给大家吧。
【微信公众号、微信群、QQ群】http://bbs.bathome.net/thread-3473-1-1.html
【支持批处理之家，加入VIP会员！】http://bbs.bathome.net/thread-67716-1-1.html

Rank: 8 Rank: 8

帖子: 1069
积分: 12123
技术: 38
捐助: 0
注册时间: 2008-5-10

23楼

发表于 2009-6-27 14:51 | 只看该作者

虽然只开关一次I/O，但仍然是边输出边写入文件。
可以推知，只启用一次IO时，并不是将输出缓存到内存，等到全部输出结束后再一次性写入文件。
如果楼主的测试可信的话，似乎可以得知：可能开关I/O消耗的时间极短，主要耗时花在通过I/O进行数据传输和写文件，尤其是写文件。

命令行参考：hh.exe ntcmds.chm::/ntcmds.htm
求助者请拿出诚心，别人才愿意奉献热心！
把查看手册形成条件反射！