标题: [其他] 【已解决】gawk:提取出现最多次数的字符 [打印本页]
作者: 思想之翼 时间: 2023-5-22 17:17 标题: 【已解决】gawk:提取出现最多次数的字符
本帖最后由 思想之翼 于 2023-5-25 02:51 编辑
D:\JZ\A.txt 如果每行只有1个字母
G
B
J
J
E
E
结果 J E 竖排写入D:\JZ\B.txt- gawk "{++a[$0];a[$0]>n+0?n=a[$0]:n=n+0}END{for(i in a)if(a[i]==n)print i}" "D:\JZ\A.txt">"D:\JZ\B.txt"
复制代码
- gawk "{n=n<++a[$0]?a[$0]:n}END{for(k in a)if(n==a[k])print k}"<"D:\JZ\A.txt">"D:\JZ\B.txt"
复制代码
- gawk "{if(max<=++a[$0]){max=a[$0];b[max]=b[max]$0\"\n\"}}END{printf b[max]}" D:\JZ\A.txt > D:\JZ\B.txt
复制代码
D:\JZ\A.txt 如果每行有若干字母
G B B
B C C C A
J
J
E
E
结果 B C
上述代码如何修改?
作者: terse 时间: 2023-5-22 19:57
加个FOR 利用NF应该行
作者: terse 时间: 2023-5-22 20:49
这样符合不
路径自己加一下- gawk "{for(i=1;i<=NF;i++) a[$i]++} END {for(k in a) if(a[k]>max){max=a[k];s=k}else if(a[k]==max)s=s\" \"k; print s}" a.txt
复制代码
作者: hfxiang 时间: 2023-5-23 12:12
回复 1# 思想之翼 - gawk "{for(i=1;i<=NF;i++)n=n<++a[$i]?a[$i]:n}END{for(k in a)if(n==a[k])print k}" "D:\JZ\A.txt">"D:\JZ\B.txt"
复制代码
欢迎光临 批处理之家 (http://bbs.bathome.net/) |
Powered by Discuz! 7.2 |