找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 33147|回复: 10

[文本处理] [已解决]批处理怎样提取网页中的指定链接地址?

[复制链接]
发表于 2013-5-16 02:07:23 | 显示全部楼层 |阅读模式
本帖最后由 pcl_test 于 2016-7-11 10:35 编辑

src="/upload/portal/WP_btn201208210254434666201304031950224696.gif" //p/aspan id=bnote style="color:#696969;"div class="hide_down"a href="javascript:downphoneclient('http://122.224.214.248/enterprise/ECP_WP7.xap')"Windows Phone7版br/i(V1.6)/i/aa href="javascript:downphoneclient('http://122.224.214.248/enterprise/ECP_WP8.xap')"Windows Phone8版br/i(V2.0.2.0)/i/a/div  i class="version_down" /ibr/ 操作系统:windows phone7/span/divdiv class="downsysten_contentnew "pimg border="0" alt="" width="156" height="80" src="/upload/portal/p1201208271913085436.gif" //pbra href="javascript:downphoneclient('http://update.ecpchina.com/download/autoupdate/158_1.0.2.0_1exe/yiliao1.0.2.0.exe')"pimg alt="" width="156" height="65" src="/upload/portal/p4201301291238282437201304031954406182.jpg" //p/aspan id=bnote style="color:#696969;" i class="version_down"版本号:1.0.2.0/ibr/操作系统:windows 2000以上/span/div


以上为文本内容    或者直接获取网页源代码  http://liao.189.cn/page/app/down.jsp 并提取链接地址
怎么提取其中的  链接 http://update.ecpchina.com/downl ... e/yiliao1.0.2.0.exe
由于地址中间会有点变化 要求以 查找开头 和 结尾之间的字符 得到这个地址    或者其他好的办法
由于行字符太长 不能执行

评分

参与人数 1PB +2 收起 理由
Batcher + 2 感谢给帖子标题标注[已解决]字样

查看全部评分

发表于 2013-5-16 08:26:07 | 显示全部楼层
  1. sed "/http:/!d; s/.*\(http:[^']*\.exe\).*/\1/" a.txt
复制代码

评分

参与人数 1技术 +1 收起 理由
web + 1 谢谢

查看全部评分

发表于 2013-5-16 13:22:47 | 显示全部楼层
  1. sed "s/\'/\r\n/g" a.txt |sed "/^http.*exe/!d"
复制代码

评分

参与人数 1技术 +1 收起 理由
web + 1 也可以达到 目的 还行

查看全部评分

 楼主| 发表于 2013-5-16 18:00:35 | 显示全部楼层
回复 3# wjx515


    问题可以解决了 但是处理下载的网页的话做不到  楼上的可以  谢谢了
 楼主| 发表于 2013-5-16 18:02:58 | 显示全部楼层
本帖最后由 web 于 2013-5-16 18:20 编辑

回复 2# BAT-VBS


    Invalid keyboard code specified
如果 保存 这一句怎么不输出啊

同样网页的会得到 多余的内容 不过倒是可以在处理
发表于 2013-5-16 18:13:13 | 显示全部楼层
回复 5# web


你用的哪个版本?试试4.2.2
http://www.bathome.net/thread-16975-1-1.html
 楼主| 发表于 2013-5-16 18:26:55 | 显示全部楼层
回复 6# Batcher


    [new]sed-4.2.1-bin.zip    得不到结果

sed4.2.1.zip  这个可以
但会有   Invalid keyboard code specified


处理下载的网页jsp源码会得到 多余的内容      http://liao.189.cn/page/app/down.jsp
Invalid keyboard code specified
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
                                        <li><a class='li_a2' href="http://liao.189.cn/page/app/index.html">首页</a></li><li><a class='li_a2' href="http://liao.189.cn/reg/">注册</a></li><li><a class='li_a1' style="background-image:url(../../images/menu_on1.gif);" href="http://liao.189.cn/page/app/down.jsp">下载</a></li><li><a class='li_a2' href="http://liao.189.cn/page/app/activity1.html">活动</a></li><li><a class='li_a2' href="http://liao.189.cn/reg/service.html">账号服务</a></li><li><a class='li_a2' href="http://liao.189.cn/nobbs.html">论坛</a></li><li><a class='li_a2' href="http://liao.189.cn/page/app/help.html">帮助</a></li>
http://update.ecpchina.com/downl ... e/yiliao1.0.2.0.exe
                        <a href="http://e.weibo.com/liao189" style=""><img src="../../images/sina_logo.gif" align="middle" /></a>
                        <a href="http://t.qq.com/ecplive" style="margin-left: 20px;"><img src="../../images/tencent_logo.gif" align="middle" /> </a>
                        var basepath = "http://liao.189.cn:80/";
发表于 2013-5-16 18:39:16 | 显示全部楼层
回复 7# web


    4.2.2结果如何?
 楼主| 发表于 2013-5-16 18:56:22 | 显示全部楼层
本帖最后由 web 于 2013-5-16 19:06 编辑

回复 8# Batcher


    没有下载到   Sed-4.2.2-bin.zip: http://code.google.com/p/gnu-on-windows/downloads/list
暂时下不到

经过反复 测试 这句没有了 Invalid keyboard code specified
发表于 2013-5-16 20:05:15 | 显示全部楼层
 楼主| 发表于 2013-5-19 11:13:17 | 显示全部楼层
回复 10# Batcher


    这几天有下载了几次 结果我这里还是不能下载到  不过问题是解决了 谢谢
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-21 07:53 , Processed in 0.018559 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表