找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 19593|回复: 6

[文本处理] 批处理如何提取特定内容重复的行?[已解决]

[复制链接]
发表于 2022-11-28 17:08:25 | 显示全部楼层 |阅读模式
本帖最后由 每天几分 于 2022-11-28 22:56 编辑

文本1
  1. 进行        jbxk
  2. 还有        hdyz
  3. 见家长        jjv
  4. 中国        vsgohl
  5. 进行        jbhhrj
  6. 进行        jbxkrj
  7. 进行        jbhgrj
  8. 进行        jbhkrj
  9. 已经        yijkns
  10. 还有        hdyzde
  11. 还有        hryzde
  12. 见家长        xjvta
  13. 见家长        jjvta
  14. ……
  15. 君不见高堂明镜悲白发        jbjf
  16. 君不见高堂明镜悲白发        jbxfv
  17. 君不见高堂明镜悲白发        jbjfv
  18. ……
复制代码
实现如下:
文本2
  1. ……
  2. 进行        jbxkrj
  3. 还有        hdyzde
  4. 见家长        jjvta
  5. 君不见高堂明镜悲白发        jbjfv
  6. ……
复制代码
即:如果后面行部分内容,跟前面行重复,则提取出来。

多谢楼下各位的帮助
发表于 2022-11-28 20:02:39 | 显示全部楼层
  1. @echo off
  2. PowerShell "$arr = gc 1.txt -Read 0; $len = $arr.Count-1; $out = for($i=0; $i -lt $len; $i++){$arr[($i+1)..$len] -match ([regex]::Escape($arr[$i]) + '.+$')} sc 2.txt -Value $out"
  3. pause
复制代码
发表于 2022-11-28 20:13:21 | 显示全部楼层
回复 1# 每天几分
  1. @echo off
  2. cd /d "%~dp0"
  3. setlocal enabledelayedexpansion
  4. for /f "tokens=1,2" %%i in ('type "1.txt"') do (
  5.     if not defined %%i (
  6.         set "%%i=1"
  7.     ) else (
  8.         set "_%%i=%%j"
  9.     )
  10. )
  11. (for /f "tokens=1* delims==" %%i in ('set _') do (
  12.     set "str=%%i"
  13.     echo !str:~1!        %%j
  14. ))>"2.txt"
  15. endlocal
复制代码

评分

参与人数 1技术 +1 收起 理由
每天几分 + 1 多谢

查看全部评分

发表于 2022-11-28 21:27:40 | 显示全部楼层

  1. gawk "!b[$1]{a[++N]=$1}{b[$1]=$0;c[$1]++}END{for(i=0;i++<N;)if(c[a[i]]>1)print b[a[i]]}" 1.txt>2.txt
复制代码

评分

参与人数 1技术 +1 收起 理由
每天几分 + 1 多谢,这个执行很快

查看全部评分

发表于 2022-11-28 22:03:02 | 显示全部楼层
最近都是去重题
  1. PowerShell "cat .\1.txt|group {$_.split("        ")[0]}|?{ $_.Count -gt 1 }|%% { $_.group[-1]}"
复制代码
发表于 2022-11-29 00:15:55 | 显示全部楼层
本帖最后由 aloha20200628 于 2022-11-29 00:19 编辑

试用 more+findstr 提炼一下纯P代码...

  1. @echo off &setlocal enabledelayedexpansion
  2. set/a "m=0"
  3. (for /f "delims=" %%s in (1.txt) do (
  4.      set/a "m+=1"
  5.      more +!m! "1.txt"|findstr /i /c:"%%~s"
  6. ))>2.txt
  7. endlocal&exit/b
复制代码
发表于 2022-11-29 13:53:05 | 显示全部楼层
楼主每次提问都让人匪夷所思。
既然要提取最后一个重复项,为啥又说"部分内容相同"?文本2也是驴唇不对马嘴。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-19 09:18 , Processed in 0.015456 second(s), 9 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表