Board logo

标题: [文本处理] 【已解决】如何用gawk统计文本记录数值的出现次数 [打印本页]

作者: 思想之翼    时间: 2023-7-12 05:33     标题: 【已解决】如何用gawk统计文本记录数值的出现次数

本帖最后由 思想之翼 于 2023-7-12 09:05 编辑

文本1.txt记录数值如下:
331 445 550 567
008 023 327 550 689
142 350 331 449 550 653

如何用gawk ,统计1.txt记录数值的出现次数,统计结果写入2.txt ?

文本2.txt 记录格式为:
331        2
445        1
550        3
567        1
008        1
023        1
327        1
689        1
142        1
350        1
449        1
653        1
  1. gawk "{for(i=1;i<=NF;i++)a[$i]++}END{for(j in a)print j,a[j]}" 1.txt>2.txt
复制代码
注:下列代码只适用 待统计文本 为一列数据
  1. gawk "{a[$0]++}END{for(j in a)print j,a[j]}" 1.txt>2.txt
复制代码
http://bbs.bathome.net/thread-25608-1-1.html
作者: qixiaobin0715    时间: 2023-7-12 10:25

本帖最后由 qixiaobin0715 于 2023-7-12 10:29 编辑

不用第三方,小批量,数值个数(重复的不做统计)最好不要超过8000:
  1. @echo off
  2. for /f "delims=" %%i in (1.txt) do for %%j in (%%i) do set /a _%%j+=1
  3. (for /f "tokens=1,2 delims=_=" %%k in ('set _') do echo,%%k %%l)>2.txt
  4. pause
复制代码

作者: DAIC    时间: 2023-7-12 11:42

回复 1# 思想之翼


单列数据.bat
  1. powershell "Get-Content '1.txt' | Group-Object | ForEach-Object {$_.Name + ' ' + $_.Count} | Out-File '2.txt'"
复制代码

作者: DAIC    时间: 2023-7-12 11:43

回复 1# 思想之翼


多行数据.bat
  1. powershell "(Get-Content '1.txt').Split('`n').Split('') | Group-Object | ForEach-Object {$_.Name + ' ' + $_.Count} | Out-File '2.txt'"
复制代码





欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2