Board logo

标题: [文本处理] 【已解决】gawk:如何合并多行多列同类相,且对应右侧数值求和 [打印本页]

作者: 思想之翼    时间: 2023-9-11 22:26     标题: 【已解决】gawk:如何合并多行多列同类相,且对应右侧数值求和

本帖最后由 思想之翼 于 2023-9-12 11:04 编辑

【示例】
D:\DATA\A.txt 记录数值只有2列,格式如下:
331        20000
550        3333
653        19999
331        20000
653        11111
550        3333
合并左侧同类相,且右侧数值求和。
结果B.txt为:
331        40000
550        6666
653        31110
【解决方案】
  1. gawk "{a[$1]+=$2}END{for(i in a)print i,a[i]}" A.txt > B.txt
复制代码
【问题1】
若D:\DATA\A.txt 记录数值多行多列(示例只列举了6列),格式如下:
331        20000        653        11111        653        19999
550        3333          331        20000        550        3333
如何用gawk,合并第1 3 5列同类相,第2 4 6列对应数值求和?
结果B.txt为:
331        40000
550        6666
653        31110

【问题2】
若上例结果B.txt,以第2列数值从多到少排序,在此基础上,第1列数值从小到大排序,如何用gawk解决?
示例:
331        40000【第2列数值最多】
456        40000
000        31110【第2列数值次多】
653        31110
550        6666  【第2列数值最少】
666        6666
888        6666
作者: Five66    时间: 2023-9-11 23:43

不知行否?输出是无序的
  1. gawk "{for(i=1;i<=NF;i++){if(i%%2==0){A[$(i-1)]+=$i}}}END{for(i in A){print i\" \"A[i]}}" D:\DATA\A.txt >B.txt
复制代码

作者: wanghan519    时间: 2023-9-12 06:15

本帖最后由 wanghan519 于 2023-9-12 09:48 编辑

加上一句xargs -n2也许可以
  1. cat a.txt | xargs -n2 | awk '{a[$1]+=$2}END{for(i in a)print i,a[i]}'
复制代码
排序大概是
  1. cat a.txt | xargs -n2 | sort -k2nr -k1n
复制代码

用的是busybox-w32
作者: buyiyang    时间: 2023-9-12 09:11

改一下输出顺序
  1. gawk "function cmp_num(i1,v1,i2,v2){return (v1<v2?1:(v1>v2?-1:(i1<i2?-1:(i1>i2?1:0))))}{n=NF;while(i=n--)if(i%%2==0)A[$(i-1)]+=$i}END{PROCINFO[\"sorted_in\"]=\"cmp_num\";for(i in A){print i\" \"A[i]}}" D:\DATA\A.txt >B.txt
复制代码





欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2