找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 23903|回复: 3

[文本处理] [已解决]批处理提取多个文本中的特定字符间的段落

[复制链接]
发表于 2010-3-26 11:19:51 | 显示全部楼层 |阅读模式
1、文件夹有多个文本mflistpic(*),想把每个文本中的<ul>到</ul>的段落提取出来,存入文本A。每个文本有三个这样的标识。
文本实际上是http源代码。

2、第一步就够了,如果能够这样就更加完美。

<LI><A title="寒地小浆果优质丰产栽培技术" href="read.aspx?ssid=12220093" target=_blank</A>
<P><A title="寒地小浆果优质丰产栽培技术" href="read.aspx?ssid=12220093" target=_blank>寒地小浆果优质丰产栽培技术</A></P></LI>

谢谢!!

评分

参与人数 1PB +2 收起 理由
Batcher + 2 感谢主动给标题标注[已解决]字样

查看全部评分

发表于 2010-3-26 11:36:00 | 显示全部楼层
  1. sed "/<ul>.*<\/ul>/!d;s/<ul><LI>/\n/g;s/<\/LI><\/ul>/\n/g;" mflistpic(1).txt >a.txt
复制代码

评分

参与人数 1PB +2 收起 理由
lxh623 + 2 谢谢!

查看全部评分

发表于 2010-3-26 12:24:02 | 显示全部楼层
  1. sed ":a N; s/\n\|\t//g;  ta" test.txt | sed "s/<ul>\|<\/ul>/\n&\n/g;" | sed "/<LI><A /!d" | sed "s/<P>/\n&/g"
复制代码

评分

参与人数 1PB +2 收起 理由
lxh623 + 2 谢谢!

查看全部评分

 楼主| 发表于 2010-3-27 11:21:48 | 显示全部楼层
真心地感谢二位帮助!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-20 08:26 , Processed in 0.018910 second(s), 14 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表