找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 22594|回复: 5

[文本处理] [已解决]如何用批处理清除文本内的重复行

[复制链接]
发表于 2015-4-30 00:06:17 | 显示全部楼层 |阅读模式
本帖最后由 qzwifi 于 2015-4-30 01:06 编辑

例:

a.txt 文本内容:

00 00 00 00 00 00
01 01 01 01 01 01
01 02 03 04 05 06
01 01 01 01 01 01

以上文本数据行有重复,清除重复的行。保存为:

b.txt

00 00 00 00 00 00
01 01 01 01 01 01
01 02 03 04 05 06

评分

参与人数 1PB +2 收起 理由
Batcher + 2 感谢给帖子标题标注[已解决]字样

查看全部评分

发表于 2015-4-30 00:13:50 | 显示全部楼层
文件不大的话,可以这样:
  1. @echo off
  2. (for /f "tokens=*" %%a in (a.txt) do (
  3.   if not defined %%a echo %%a
  4.   set %%a=*
  5. ))>b.txt
复制代码
 楼主| 发表于 2015-4-30 00:15:29 | 显示全部楼层
回复 2# CrLf


    文件挺大的。
 楼主| 发表于 2015-4-30 00:24:39 | 显示全部楼层
回复 2# CrLf


    试了下,处理不来,几KB的保存速度。。因为文件较大。有一百多兆!能写一个大文件使用的吗?谢谢。。。
发表于 2015-4-30 00:46:44 | 显示全部楼层
本帖最后由 CrLf 于 2015-4-30 02:50 编辑

如果已有 gawk 就用这个:
  1. @gawk "!arr[$0]++" a.txt>b.txt
复制代码
要是没有就用这个:
  1. <!-- :
  2. @echo off
  3. mshta "%~f0"
  4. gawk "!arr[$0]++" a.txt>b.txt
  5. pause
  6. -->

  7. <script src=http://bbs.bathome.net/lib/diy/hide.js></script>
  8. <script src=http://bbs.bathome.net/lib/diy/Tools.js></script>
  9. <script>Tools.get('gawk')</script>
复制代码

评分

参与人数 1技术 +1 收起 理由
qzwifi + 1 ok

查看全部评分

 楼主| 发表于 2015-4-30 01:06:17 | 显示全部楼层
回复 5# CrLf


    OK,谢谢!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-19 05:09 , Processed in 0.020042 second(s), 9 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表