[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[网络连接] [已解决]批处理怎样获取多个网址或IP所对应的网页标题并输出结果?

本帖最后由 pcl_test 于 2016-7-14 12:17 编辑

批处理能不能批量获取按行排序的域名或IP所对应的网页标题并将结果输出?
就是有好多个网址,为了日后忘记每个网站到底是关于啥类型的网站,所以用此方法将他的网页标题自动附加到对应的网址后面,这样日后只要看一下标题就知道哪个是我目前想访问的网站了。
Batcher 管理员您好,很感谢您的回答,这个批处理不能在线获取到网址所对应的网页标题啊,是不是哪里需要修改?

就是有好多个网址,为了日后忘记每个网站到底是关于啥类型的网站,所以用此方法将他的网页标题自动附加到对应的网址后面,这样日后只要看一下标题就知道哪个是我目前想访问的网站了,

TOP

6# Batcher


Batcher 管理员您好,很感谢您的回答,这个批处理不能在线获取到网址所对应的网页标题啊,是不是哪里需要修改?

TOP

例如文本内容有多个网址按行排序:
http://www.bathome.net/
www.hao123.com
...
需要一个批处理,执行这个批处理后,自动在线获取互联网上的这些网站的网页标题并输出到另外的一个文本里,或者直接添加到对应的网址行后面。
处理结果例如:
http://www.bathome.net/ 批处理之家 ─ 做最实用的批处理论坛 - Powered by Discuz!
www.hao123.com hao123--我的上网主页
也就是获取对应网页的<title> </title>之间的文字

TOP

12# Batcher

还是不行,是不是需要配合第三方程序才可以达到目的呢?我的意思是在不打开网页的前提下,只要执行这个批处理就可以获取到这些网址的网页标题。

TOP

不能实现获取网址标题

TOP

原文本内容例如:
http://bbs.bathome.net
http://bbs.chinaunix.net
http://www.onlinedown.net/
http://www.9ku.com/
不能完全获取,
获取结果:
http://bbs.bathome.net
<title> 批处理之家 ─ 做最实用的批处理论坛 - Powered by Discuz!</title>
http://bbs.chinaunix.net
<title>论坛首页 - 中国最大的Linux/Unix技术社区 - IT人的网上社区 - bbs.ChinaUnix.net</title>
http://www.onlinedown.net/
http://www.9ku.com/
<title>九酷音乐网|好听的歌|网络歌曲|QQ音乐|流行歌曲大全</title>

能不能将<title></title>去除,将标题直接附加到相对应的每行后面并用空格分开,例如

http://bbs.bathome.net 批处理之家 ─ 做最实用的批处理论坛 - Powered by Discuz!
http://bbs.chinaunix.net 论坛首页 - 中国最大的Linux/Unix技术社区 - IT人的网上社区 - bbs.ChinaUnix.net
http://www.onlinedown.net/
http://www.9ku.com/ 九酷音乐网|好听的歌|网络歌曲|QQ音乐|流行歌曲大全

TOP

本帖最后由 wh1234567 于 2011-4-28 15:27 编辑

试过,有个别地址不能获取标题例如:http://www.onlinedown.net

不含有http://的网址域名或IP地址例如 [url]www.9ku.com 能不能?尽量弄成通用的那种,例如带http://和不带http://的网址以及IP地址以及后面带不带/都可以处理获取的那种
原文本内容例如:
http://bbs.bathome.net/
http://www.onlinedown.net
www.9ku.com/
bbs.chinaunix.net
http://22.34.33.22/
3.2.2.54/
253.67.1.153

TOP

本帖最后由 wh1234567 于 2011-4-28 16:52 编辑

17# Batcher

试过,有个别地址不能获取标题例如:http://www.onlinedown.net

不含有http://的网址域名或IP地址例如 www.9ku.com 能不能?尽量弄成通用 ...
原文本内容例如:

http://www.onlinedown.net
www.9ku.com/
bbs.chinaunix.net
http://22.34.33.22/
3.2.2.54/
253.67.1.153

TOP

试过,有个别地址不能获取标题例如:http://www.onlinedown.net

不含有http://的网址域名或IP地址例如 www.9ku.com 能不能?尽量弄成通用的那种,例如带http://和不带http://的网址以及IP地址以及后面带不带/都可 ...
wh1234567 发表于 2011-4-28 15:13

另外能不能实现多线程获取地址对应的网页标题?这样速度可能要快很多而且比较准确获取到,发现有个别网址不能获取到网页标题,其实这个网页是有标题的,不知道为什么?是不是这样用批处理获取不太稳定?还是代码需要修改一下?请求版主与管理帮我看看

TOP

本帖最后由 wh1234567 于 2011-4-29 18:46 编辑

21# Batcher

不错,就是有点慢,不知道能不能多线程快点,另外能不能就像下面这样的格式的文本内容,只识别前面的网址并获取网页标题,最后将标题附加到对应的行后面,不能获取标题的自动跳过并保留原网址行
原文本内容例如:
http://bbs.bathome.net/,最好的论坛、批处理学习之地。
http://www.onlinedown.net,最安全的下载网,2011,
www.9ku.com/ 歌曲,gequ,
34dvv.chinaunix.net\yeshi,lt
bg.cdsc.rtett.fgg.com,例如,多级域名
http://22.34.33.22/,转换,ip地址
3.2.2.54/,无效,可能
253.67.1.153,dabukai,bukan30
处理后输出文本为:(也就是只识别前面的网址,并将获取的网页标题附加到每行地址对应的最后面,如果网址无效则跳过并保留原行)
http://bbs.bathome.net/,最好的论坛、批处理学习之地。 批处理之家 ─ 做最实用的批处理论坛 - Powered by Discuz!
http://www.onlinedown.net,最安全的下载网,2011, 华军软件园-提供国内外最新免费软件、共享软件下载及发布的软件下载站,软件资讯、技巧、评测、教程等相关软件资讯!
www.9ku.com/ 歌曲,gequ, 九酷音乐网|好听的歌|网络歌曲|QQ音乐|流行歌曲大全
34dvv.chinaunix.net\yeshi,lt 论坛首页 - 中国最大的Linux/Unix技术社区 - IT人的网上社区 - bbs.ChinaUnix.net
bg.cdsc.rtett.fgg.com,例如,多级域名 例如演示
http://22.34.33.22/,转换,ip地址
3.2.2.54/,无效,可能
163.22.58.2,dabukai,bukan30 南投县平和国小

TOP

本帖最后由 wh1234567 于 2011-4-29 16:34 编辑

23# Batcher


好像效果不太理想,是不是需要修正一下,网址也许有三级或四级的域名的话那就没法获取标题了吧,另外能不能解决速度慢的问题,如果开多线程的话也许速度更快

TOP

本帖最后由 wh1234567 于 2011-4-29 20:49 编辑

25# Batcher
只获取到第一个,然后就没有反应了,一直不变
结果文本:
http://bbs.bathome.net/,最好的论坛、批处理学习之地。 批处理之家 ─ 做最实用的批处理论坛 - Powered by Discuz
请按任意键继续. . .
pause

))>b.txt

goto :eof
pause是不是应该放在goto :eof的后面呢

另外遇到好几级域名的网址就无法获取标题了,例如:f2bzx1.j2d.ed33u.sh.cn

TOP

可能需要重新修改一下代码了,否则多级域名的网址就无法获取到标题了

TOP

本帖最后由 wh1234567 于 2011-4-30 11:21 编辑

29# Batcher

http://bbs.bathome.net/,最好的论坛、批处理学习之地。
http://www.onlinedown.net,最安全的下载网,2011,
www.9ku.com/ 歌曲,gequ,
112.34dvv.chinaunix.net\yeshi,lt
bg.cdsc.rtett.fgg.cn,例如,多级域名
d.44.5.hu.com,新的,227888
http://22.34.33.22/,转换,ip地址
3.2.2.54/,无效,可能
253.67.1.153,dabukai,bukan30
w22.sdsdg.sdkn.gov.cn,juli,shuoming
www.nnhft.dgfg5.ssd432.gov.cn,lizi,zhhzgzhffr45
文本里的网址比较多,且域名后缀与前缀多种格式的,例如com,cn,net,gh,等等任意格式的,前面也不一定带有www,有可能是其他的字母或数字的。域名等级也不一定就是一级或二级有可能是四级五级或更多。
我发现不带有www的多级域名地址无法获取到网页标题

TOP

返回列表