标题: [文本处理] [已解决]批处理如何在一段文字中提取所需要的特征字? [打印本页]
作者: xptool 时间: 2010-10-5 13:52 标题: [已解决]批处理如何在一段文字中提取所需要的特征字?
如何用bat处理一段文字中的特征字,提取所需要的文字
1 把每行中包含特征字 &pin 前面一段提取出来
例如 <span onClick=change_img('../images/n1.bmp','tmp2') style=CURSOR:hand> <a href=downsong.asp?musicid=0&pin=1a248eefe9079208adedfb0b8f391e59 target=blank><img src=../images/2.gif name='tmp2' border=0 align=absbottom></a></span>
结果
<span onClick=change_img('../images/n1.bmp','tmp2') style=CURSOR:hand> <a href=downsong.asp?musicid=0&pin
2 把每行中不包含特征字 &pin 前面一段提取出来
结果
<span onClick=change_img('../images/n1.bmp','tmp2') style=CURSOR:hand> <a href=downsong.asp?musicid=0
3 提取包括特征字符 &pin 在内的后部分字段
结果
&pin=1a248eefe9079208adedfb0b8f391e59 target=blank><img src=../images/2.gif name='tmp2' border=0 align=absbottom></a></span>
4 提取不包括特征字符 &pin 在内的后部分字段
结果
&pin=1a248eefe9079208adedfb0b8f391e59 target=blank><img src=../images/2.gif name='tmp2' border=0 align=absbottom></a></span>
5 提取包含二个特征字符 &pin和border=0 在内的字符段材料
结果
&pin=1a248eefe9079208adedfb0b8f391e59 target=blank><img src=../images/2.gif name='tmp2' border=0
6 提取不包含二个特征字符间 &pin和border=0 在内的字符段材料
=1a248eefe9079208adedfb0b8f391e59 target=blank><img src=../images/2.gif name='tmp2'
7 把每行中的数字 提取出来
恳请各位朋友解决一下 谢谢[已解决]
[ 本帖最后由 xptool 于 2010-10-20 12:57 编辑 ]
作者: CUer 时间: 2010-10-5 16:32
- sed -r "s/(.*&pin).*/\1/" 1.txt
复制代码
- sed -r "s/(.*)&pin.*/\1/" 1.txt
复制代码
- sed -r "s/.*(&pin.*)/\1/" 1.txt
复制代码
- sed -r "s/.*&pin(.*)/\1/" 1.txt
复制代码
- sed -r "s/.*(&pin.*border=0).*/\1/" 1.txt
复制代码
- sed -r "s/.*&pin(.*)border=0.*/\1/" 1.txt
复制代码
第7个希望的结果是什么?
作者: xptool 时间: 2010-10-5 16:38
希望提取数字
结果 12489079208083915922
[ 本帖最后由 xptool 于 2010-10-5 16:46 编辑 ]
作者: xptool 时间: 2010-10-5 16:41
sed在xp 怎么设置呀
谢谢朋友 速度好快
再提2个问题
8如何提取每行左边8个字符
9如何提取每行右边8个字符
是不是for 语句效果不好
[ 本帖最后由 xptool 于 2010-10-5 16:44 编辑 ]
作者: Batcher 时间: 2010-10-5 20:20 标题: 回复 4楼 的帖子
去下载一个就行了,不需要设置。
http://bbs.bathome.net/thread-1114-1-1.html
欢迎光临 批处理之家 (http://bbs.bathome.net/) |
Powered by Discuz! 7.2 |