找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 23960|回复: 4

[文件操作] 批处理能否截取网页源码中的指定内容?

[复制链接]
发表于 2011-7-30 15:07:12 | 显示全部楼层 |阅读模式
本帖最后由 pcl_test 于 2017-2-27 13:39 编辑

比如 这个网站 http://www.baidu.com/s?tn=jilin5 ... thome&tn_flag=1

源码中有这句话<div id="foot">&copy;2011 Baidu <span>此内容系百度根据您的指令自动搜索的结果,不代表百度赞成被搜索网站的内容或立场</span></div>

取中文汉字..

能不能....
 楼主| 发表于 2011-7-30 18:25:13 | 显示全部楼层
回复 2# else     谢谢了
发表于 2011-7-30 23:02:42 | 显示全部楼层
  1. sed -r "/Baidu <span>/!d; s/.*<span>(.*)<\/span>.*/\1/" a.htm >a.txt
复制代码
发表于 2011-7-30 23:06:12 | 显示全部楼层
  1. gawk -F "[<>]+" "/Baidu <span>/{print $5}" a.htm >a.txt
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-19 15:22 , Processed in 0.017967 second(s), 8 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表