注册
登录
论坛
搜索
帮助
导航
私人消息 (0)
公共消息 (0)
论坛任务 (0)
系统消息 (0)
好友消息 (0)
帖子消息 (0)
批处理之家
»
UNIX/Linux Shell
» [已解决]gawk 如何识别文本中相同行 并在末尾加数字
[新手上路]
批处理新手入门导读
[视频教程]
批处理基础视频教程
[视频教程]
VBS基础视频教程
[批处理精品]
批处理版照片整理器
[批处理精品]
纯批处理备份&还原驱动
[批处理精品]
CMD命令50条不能说的秘密
[在线下载]
第三方命令行工具
[在线帮助]
VBScript / JScript 在线参考
返回列表
发帖
daohe
发短消息
加为好友
daohe
当前离线
UID
23008
帖子
117
精华
0
积分
343
PB
343
技术
0
捐助
0
阅读权限
20
在线时间
50 小时
注册时间
2010-4-1
最后登录
2020-4-8
五级士官
帖子
117
积分
343
技术
0
捐助
0
注册时间
2010-4-1
1
楼
跳转到
»
倒序看帖
打印
字体大小:
t
T
发表于 2015-7-12 15:51
|
显示全部帖子
[问题求助]
[已解决]gawk 如何识别文本中相同行 并在末尾加数字
本帖最后由 daohe 于 2015-7-12 17:16 编辑
一个a.txt,
有一百万行数据, 里面有30% 重复行
碰到重复行后, 在重复的第二行 第三行....第N行, 并在末尾标上一个空格和一个数字, 1, 2, 3, 4,...
举例说明
a.txt 内容如下
aaa
bbb
aaa
ddd
aaa
fff
bbb
处理后变成
aaa
bbb
aaa 1
ddd
aaa 2
fff
bbb 1
收藏
分享
daohe
发短消息
加为好友
daohe
当前离线
UID
23008
帖子
117
精华
0
积分
343
PB
343
技术
0
捐助
0
阅读权限
20
在线时间
50 小时
注册时间
2010-4-1
最后登录
2020-4-8
五级士官
帖子
117
积分
343
技术
0
捐助
0
注册时间
2010-4-1
2
楼
发表于 2015-7-12 17:15
|
显示全部帖子
回复
2#
CrLf
谢谢, 我在后面加了 >b.txt 才能看到结果
所以代码是这样的
gawk "ar[$0]++{$0=$0 FS ar[$0]-1}1" a.txt >b.txt
复制代码
TOP
返回列表
VBS原创&转载
第三方命令行
Python
有偿求助
BAT教程&资料
PowerShell求助&讨论
BAT转载代码
VBS求助&讨论
VBS教程&资料
Perl
批处理专区: BAT CMD DOS
BAT求助&讨论
BAT教程&资料
BAT原创&转载
BAT新大陆
BAT转载代码
新手练功
出题挑战
有偿求助
第三方命令行
开源原创工具
iBAT
Take Command
其他脚本区
PowerShell求助&讨论
PowerShell教程&资料
PowerShell原创&转载
VBS求助&讨论
JS / JScript / JavaScript
VBS教程&资料
VBS原创&转载
UNIX/Linux Shell
Python
Perl
网络资源区
电脑技术研讨
精品软件交流
论坛事务区
站务交流
意见反馈
论坛公告
版主申请
交换链接
建站杂谈
活动专区
论坛总版规
[收藏此主题]
[关注此主题的新回复]
[通过 QQ、MSN 分享给朋友]