[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[文本处理] 【已解决】gawk:如何实现按出现次数排序

本帖最后由 思想之翼 于 2025-1-15 10:05 编辑

1.txt 格式如下:
331 445 550 567 0000
008 023 327 550 689
142 350 331 449 550 653
0 0 0 0 0 0 0 0 0 0 0 0
X Y Z
A A A A A A A A A A A A A

下述代码将 1.txt 数值按出现次数排序:
  1. gawk "{for(i=1;i<=NF;i++){if(!a[$i]++)b[++j]=$i;if(0+N<a[$i])N=a[$i]}}END{for(k=1;k<=j;k++)c[a[b[k]]]=c[a[b[k]]]b[k]\" \";s=asorti(c,tA);for(i=s;i>0;i--)print c[tA[i]]}" 1.txt > 2.txt
复制代码
2.txt 排序结果错误
550
331
A
0
445 567 0000 008 023 327 689 142 350 449 653 X Y Z

【问题】如何实现正确的排序结果:
A     (出现13次)
0     (出现12次)
550 (出现3次)
331 (出现2次)
445 567 0000 008 023 327 689 142 350 449 653 X Y Z (出现1次)

不稳定, 相同次数的顺序不确定
  1. gawk "{for(i=NF;i;i--)A[$i]++}END{for(i in A)B[A[i]]=B[A[i]]\"\"i\" \";PROCINFO[\"sorted_in\"]=\"@ind_num_desc\";for(i in B)print B[i]}" 1.txt > 2.txt
复制代码
1

评分人数

TOP

回复 1# 思想之翼

给一个 bat+sed.exe+sort76.exe 版本,其中 sort76.exe 从本坛第三方下载 sort v76版...
  1. @echo off &setlocal &for /f "delims=" %%a in (1.txt) do for %%v in (%%a) do set/a "_#%%v+=1"
  2. (set _#)|sort76 -t "=" -r -n -k2|sed "s/^..//gi">2.txt
  3. type "2.txt"&pause&exit/b
复制代码
1

评分人数

TOP

返回列表