返回列表发帖

每天几分

三级士官

Rank: 3 Rank: 3

帖子: 134
积分: 232
技术: 0
捐助: 0
注册时间: 2012-9-21

1楼 跳转到 » 倒序看帖

打印

字体大小: tT

发表于 2022-11-27 15:29 | 只看该作者

[文本处理] [已解决]批处理如何把重复字开头的行提取出来到单独的文本？

文本1

的	diwy
的	dewy
一	yigg
是	uijh
了	lnbj
了	lebj
不	buch
在	zddf
这	vwyp
这	veyp
有	yzde
个	gewh
行	hhrf
行	xkrf
行	hgrf
人	rfww
上	uhhg
中	vskh
大	dadz
大	dddz
复制代码

把重复字开头的行提取出来到单独的文本，不重复的不用提取。
实现
文本2

的	diwy
了	lnbj
这	vwyp
大	dddz
行	hhrj
复制代码

文本3

的	dewy
了	lebj
这	veyp
行	xkrj
复制代码

文本4

行	hgrj
复制代码

1 评分人数

Batcher: 感谢给帖子标题标注[已解决]字样PB + 2

WHY

上校

Rank: 6 Rank: 6

帖子: 1482
积分: 3266
技术: 567
捐助: 0
注册时间: 2015-7-19

2楼

发表于 2022-11-27 17:15 | 只看该作者

PowerShell "gc 1.txt | group{ ($_ -split '\t')[0] } | ?{ $_.Count - 1 } | forEach{ $n=1; $_.Group|forEach{ ac ('' + ++$n + '.txt') -Value  $_ } }"
复制代码

TOP

WHY

上校

Rank: 6 Rank: 6

帖子: 1482
积分: 3266
技术: 567
捐助: 0
注册时间: 2015-7-19

3楼

发表于 2022-11-27 17:16 | 只看该作者

@echo off
setlocal enabledelayedexpansion
for /f "tokens=1*" %%i in (1.txt) do (
    set /a _%%i +=1
    if !_%%i! EQU 1 (
        set "#%%i=%%j"
    ) else if !_%%i! EQU 2 (
        >>2.txt echo;%%i	!#%%i!
        >>3.txt echo;%%i	%%j
    ) else if !_%%i! GEQ 3 (
        set /a n = !_%%i! + 1
        >>!n!.txt echo;%%i	%%j
    )
)
pause
复制代码

1 评分人数

每天几分: 多谢技术 + 1

TOP

hfxiang

上尉

Rank: 5 Rank: 5

帖子: 601
积分: 1128
技术: 166
捐助: 0
注册时间: 2022-6-20

4楼

发表于 2022-11-27 17:34 | 只看该作者

将

的	diwy
的	dewy
一	yigg
是	uijh
了	lnbj
了	lebj
不	buch
在	zddf
这	vwyp
这	veyp
有	yzde
个	gewh
行	hhrf
行	xkrf
行	hgrf
人	rfww
上	uhhg
中	vskh
大	dadz
大	dddz
复制代码

以ANSi编码格式保存为1.txt
下载gawk（ http://bcn.bathome.net/tool/4.1.0/gawk.exe ）
执行

gawk "!A[$1]{A[$1]=$0;next}{if(A[$1]!~/^[0-9]+$/){print A[$1]>\"2.txt\";print $0>\"3.txt\";A[$1]=3}else{print $0>A[$1]\".txt\"};A[$1]++}" 1.txt>con
复制代码

结果（2.txt）

的	diwy
了	lnbj
这	vwyp
行	hhrf
大	dadz
复制代码

结果（3.txt）

的	dewy
了	lebj
这	veyp
行	xkrf
大	dddz
复制代码

结果（4.txt）

行	hgrf
复制代码

1 评分人数

每天几分: 谢谢技术 + 1

TOP

返回列表

[新手上路]批处理新手入门导读	[视频教程]批处理基础视频教程	[视频教程]VBS基础视频教程	[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动	[批处理精品]CMD命令50条不能说的秘密	[在线下载]第三方命令行工具	[在线帮助]VBScript / JScript 在线参考

[文本处理] [已解决]批处理如何把重复字开头的行提取出来到单独的文本？

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]