Board logo

标题: [文本处理] 批处理怎样提取二个特定字符串间的内容? [打印本页]

作者: ghjnihao    时间: 2011-11-8 18:08     标题: 批处理怎样提取二个特定字符串间的内容?

大家好,我有大量TXT文本文件,想把中间的一部分有用内容提出来,请大家帮个忙写一个批处理脚本,
例如,1.TXT文本内容如下,
FGDFGDFGDFG<div class="titleAndAuthor"><h2>7DGFGFDGD86786786/8/414</div><div class="icons">VXCVXCVXCVXC
<div class="titleAndAuthor"><h2>GHGHG5558874148/8/4148CCVXCX452424</div>
<div class="icons">542253544534535435
我想将字符串<div class="titleAndAuthor">与字符串<div class="icons">之间的内容<h2>7DGFGFDGD86786786/8/414</div>; <h2>GHGHG5558874148/8/4148CCVXCX452424</div>提出来至另一文件夹生成2.TXT, 批处理脚本放在源文件目录下就行了,谢谢!
作者: ghjnihao    时间: 2011-11-8 18:14

补充一下,一个.TXT文件有多组这样的特定字符串,字符串<div class="titleAndAuthor">与字符串<div class="icons">有的不在同一行,我想将每组字符串间的内容都提出来.
作者: yangfengoo    时间: 2011-11-8 20:01

参照sed 俺不熟
作者: awk    时间: 2011-11-8 22:15

回复 3# yangfengoo
  1. grep -oE "<h2>[A-Za-z0-9/]+</div>" a.txt
复制代码

作者: ghjnihao    时间: 2011-11-9 02:00

朋友,不能用啊,
作者: BS0小陈    时间: 2011-11-9 08:20

问下 什么sed 啊 grep 貌似没有这些命令啊?怎么才能使用 又给怎么用啊 给个地址学习下也行
作者: awk    时间: 2011-11-9 11:44

回复 6# BS0小陈


http://bbs.bathome.net/thread-1114-1-1.html
作者: lvsehuaxue    时间: 2011-11-9 14:35

  1. @echo off&setlocal enabledelayedexpansion
  2. for /f "delims=" %%i in (a.txt) do (
  3.     set "str=%%i"
  4.     set "str=!str:*"^>=!"
  5.     for /f %%a in ("!str!") do (
  6.         set "str=%%a"
  7.         echo !str:~,-4!
  8.    )
  9. )
  10. pause
复制代码





欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2