Board logo

标题: [文本处理] 批处理怎样查找第二次出现的字串并替换为换行? [打印本页]

作者: lj84831253    时间: 2010-6-12 09:09     标题: 批处理怎样查找第二次出现的字串并替换为换行?

假设1.txt文本里边的内容为:
<a herf=11111111
<a herf=hsvkvfb<a herf=333333
<a herf=4444444
<a herf=hdhakdhad<a herf=bfsfkfsf<a herf=skfhsjfj
要求替换后1.txt里边的内容为:
<a herf=11111111
<a herf=hsvkvfb
<a herf=333333
<a herf=4444444
<a herf=hdhakdhad
<a herf=bfsfkfsf
<a herf=skfhsjfj


也就是说如果一个文本行里边如果有两个或两个以上的<a herf=,则在该行的第二个<a herf=开始以及之后的所有<a herf=前面加上换行符。
作者: hanyeguxing    时间: 2010-6-12 09:54

先备份原文件!
方法1,纯P(在必要的时候,将代码中的#替换成文本中其他不使用的字符):
  1. @echo off
  2. (for /F "delims=" %%a in (1.txt) do (set a=%%a
  3. setlocal enabledelayedexpansion
  4. set "a=!a:<a herf=&echo.#a herf=!"&call:a "!a!"
  5. Endlocal))>2.txt
  6. (for /F "delims=" %%a in (2.txt) do (set a=%%a
  7. setlocal enabledelayedexpansion
  8. set "a=!a:#=<!"&echo.!a!
  9. Endlocal))>1.txt
  10. del 2.txt&exit
  11. :a
  12. echo.%~1
复制代码
方法2,使用第三方工具如fr、sed、gawk等:
将所有的“<a herf=”替换为“回车换行符+<a herf=”,然后删除空行。

[ 本帖最后由 hanyeguxing 于 2010-6-12 15:17 编辑 ]
作者: CUer    时间: 2010-6-12 12:46

  1. sed -i -r "s/(.)(<a herf)/\1\n\2/g" 1.txt
复制代码

作者: lj84831253    时间: 2010-6-12 21:07

为什么我测试这个1.txt不成功呢?
作者: lj84831253    时间: 2010-6-12 21:07

原帖由 hanyeguxing 于 2010-6-12 09:54 发表
先备份原文件!
方法1,纯P(在必要的时候,将代码中的#替换成文本中其他不使用的字符):@echo off
(for /F "delims=" %%a in (1.txt) do (set a=%%a
setlocal enabledelayedexpansion
set "a=!a:2.txt
(for / ...
大侠你下我附件试试,,谢谢。
作者: Batcher    时间: 2010-6-12 21:40     标题: 回复 4楼 的帖子

能否把数据更新到顶楼?
作者: lvsehuaxue    时间: 2011-5-22 20:53

  1. @echo off&setlocal enabledelayedexpansion
  2. for /f "delims=" %%i in (a.txt) do call :out "%%i"
  3. pause   
  4. :out
  5. set "v=%~1"
  6. :r
  7. for /f "tokens=1* delims=<" %%i in ("!v!") do (
  8.     echo ^<%%i
  9.     if "%%j" neq "" set "v=%%j"&goto :r
  10. )
复制代码

作者: CrLf    时间: 2011-5-22 21:25

本帖最后由 zm900612 于 2011-5-22 22:42 编辑

另类思路,速度很快:
  1. @echo off&setlocal enabledelayedexpansion
  2. set hh=^
  3. (for /f "delims=" %%a in (a.txt) do (
  4. set tmp=%%a
  5. for %%b in ("!hh!") do echo !tmp:^<a herf=%%~b^<a herf!
  6.                 rem 换行符必须绕过对语句进行划分的预处理阶段,所以需要开启变量延迟,并通过for实现嵌套
  7. ))>tmp
  8. ::将所有“<”替换为“换行<”
  9. (for /f "delims=" %%a in (tmp) do echo %%a)>a.txt
  10. ::去除多余空行
复制代码





欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2