标题: [文本处理] 【已解决】BAT:统计指定文本共有元素时,如何判断实有文本个数 [打印本页]
作者: 思想之翼 时间: 2022-11-20 18:30 标题: 【已解决】BAT:统计指定文本共有元素时,如何判断实有文本个数
本帖最后由 思想之翼 于 2022-11-22 17:18 编辑
D:\资料\ 内有若干文本
001.txt记录了 1 2 3
002.txt记录了 1 2
003.txt缺失(即没有003.txt)
004.txt记录了 1
005.txt记录为空
若指定统计001 002 003 004文本记录的共有元素,003文本缺失,不纳入统计范畴,只统计实有3个文本,共有元素为1,则写入D:\统计\统计.txt;若无共有元素,则没有输出(即D:\统计\ 不出现 统计.txt)
若指定统计002 003 004 005文本记录的共有元素,003文本缺失,不纳入统计范畴,只统计实有3个文本,共有元素为空,则没有输出;若有共有元素,则写入D:\统计\统计.txt
若指定统计003 004文本记录的共有元素,003文本缺失,不纳入统计范畴,只统计实有1个文本,共有元素为1,则写入D:\统计\统计.txt;若无共有元素,则没有输出
若指定统计003 005文本记录的共有元素,003文本缺失,不纳入统计范畴,只统计实有1个文本,共有元素为空,则没有输出;若有共有元素,则写入D:\统计\统计.txt
若指定统计006 007 008 009文本记录的共有元素,006-009文本缺失,实有文本0个,共有元素为空,则没有输出。
作者: hfxiang 时间: 2022-11-21 12:01
要求所有的文档均为ANSI编码,下载gawk( http://bcn.bathome.net/tool/4.1.0/gawk.exe ),
执行- gawk "FNR==1{No++}NR==FNR{if(NF){for(i=0;i++<NF;)if($i)a[$i]=No}next}NF{for(i=0;i++<NF;)if($i)if($i in a)if(a[$i]==No-1)a[$i]=No}END{for(id in a)if(a[id]==No)print id}" "D:\统计\001.txt" "D:\统计\002.txt">"D:\统计\统计.txt"
复制代码
作者: 思想之翼 时间: 2022-11-21 13:28
本帖最后由 思想之翼 于 2022-11-21 13:34 编辑
回复 2# hfxiang
非常感谢您的帮助!经测试,001 002两文本均存在,符合题意。
若002文本缺失,应输出001文本的全部记录内容,但代码输出的是空文本,不符合题意。
若002文本为空,不应输出文本,但代码输出001文本的全部记录内容,不符合题意。
若001 002文本都缺失,不应输出文本,但代码输出了空文本,不符合题意。
欢迎光临 批处理之家 (http://bbs.bathome.net/) |
Powered by Discuz! 7.2 |