[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程批处理在线视频分享
返回列表 发帖

【已解决】40元求批处理抓网站句子

本帖最后由 lxh623 于 2018-10-15 19:36 编辑

https://www.juzimi.com/dynasty/先秦
后面有先秦名人、汉朝、魏晋、南北朝、隋唐五代、宋朝、元朝、明朝、清朝、近现代等等。最后一个国外,点开,有美国名人、英国、法国、德国、日本、俄罗斯、希腊、罗马、意大利、奥地利、印度等等。
每一个名人的名言,希望最后加上他的名字。格式“--爱因斯坦”。
https://www.juzimi.com/books
后面也有几个,书籍名句、电影台词、小说摘抄、散文美句、动漫语录、连续剧台词、古文名句。
https://www.juzimi.com/writers
下面有个按照名言内容分类,爱情 读书 励志 时间 友情 诚信 爱国 激励 勤奋 奉献 真理 道德 理想 人生 数学 英语 母爱 劳动 亲情 创新 团结 童年 感恩 目标等等。
https://www.juzimi.com/original/week
又还有本周热门原创、最新原创句子、推荐原创句子。

希望得到的结果,一个自然段为一行,第二个例子,最后的来源最好,取消转行,加个“--”附在最后一行:
喜欢(19498)
知我者,谓我心忧;不知我者,谓我何求。--《黍离》--诗经
喜欢(163)
你说,春风落十里,相思书无笔。
后来,烟火总迷离,世事已忘机。
喜欢(317)
仙人掌不是花,没人会捧在手心里--《悲伤逆流成河》
喜欢(6328)
教育就是当一个人把在学校所学全部忘光之后剩下的东西。
Education is what remains after one has forgotten everything one has learned in school.--爱因斯坦

感觉有点复杂,40元。谢谢!!
但愿是最近最后一个。不好意思!

本帖最后由 flashercs 于 2018-10-3 15:31 编辑

保存为 下载.js
下载的项目参数在最后 ,自己改
  1. (function(){function e(i){var c,n;if(c=r(i),!j[i]){for(;n=b.exec(c);)t(d+n[1]);p.WriteLine(i)}(n=S.exec(c))&&e(d+n[1])}function i(e){var c,n;if(c=r(e),!j[e]){for(;n=w.exec(c);)m.unshift("--"+n[2]),t(d+n[1]),m.shift();p.WriteLine(e)}(n=S.exec(c))&&i(d+n[1])}function t(e){var i,c,n;try{i=r(e),c=i.match(W)[0]}catch(e){c=""}if(!j[e]){for(;n=x.exec(c);){m.unshift((n[1]+(void 0===n[2]?"":n[2])).replace(g,"")),m.unshift(n[3].replace(g,"")+"\r\n");try{l.WriteLine(m.join(""))}catch(e){}finally{m.shift(),m.shift()}}p.WriteLine(e)}(n=S.exec(i))&&t(d+n[1])}function c(e){var i,t,s;try{t=r(e),i=t.match(L)[0]}catch(e){i=""}if(!j[e]){for(;s=x.exec(i);)try{l.WriteLine(s[3].replace(y,"")+"\r\n"+(s[1]+(void 0===s[2])?"":s[2]).replace(y,n)),l.WriteBlankLines(1)}catch(e){}p.WriteLine(e)}(s=S.exec(t))&&c(d+s[1])}function r(e){return WScript.Sleep(5e3),h.open("GET",e,!1),h.send(),200===h.status?h.responseText:(403===h.status&&(WScript.Echo(e+"\n403:网站拒绝下载服务,请更换IP地址后继续下载。"),l.Close(),p.Close(),WScript.Quit(403)),s('fetch URI "'+e+'" failed.\nstatus: '+h.status),"")}function n(e){var i=e.toLowerCase();return/<br\s*\/?>|<\/\s*br>/.test(i)?"\r\n":""}function s(e,i){WScript.Echo("[object Error]"===Object.prototype.toString.call(e)?[e.name,"source: "+(void 0===i?"":i),"number: "+(e.number>>>0).toString(16),"equipment: "+(e.number>>16&8191),"code: "+(65535&e.number),"Information: "+e.message].join("\n"):e)}var a,o,l,f,p,u,h=function(){for(var e=["MSXML2.XMLHTTP.6.0","MSXML2.XMLHTTP.3.0","MSXML2.XMLHTTP","Microsoft.XMLHTTP"],i=0;i<e.length;i++)try{return new ActiveXObject(e[i])}catch(e){}s("Can't build XMLHTTP automation object."),WScript.Quit(1)}(),v=new ActiveXObject("Scripting.FileSystemObject"),d="https://www.juzimi.com/",m=[],S=/<li[^>]+class="pager-next[^"]*"[^>]*>\s*<a[^>]+href="([^"]+)"[^>]*>下一页<\/a>\s*<\/li>/i,w=/<div[^>]+class="views-field-name"[^>]*>\s*<a[^>]+href="([^"]+)"[^>]*>([^<>]+)<\/a>\s*<\/div>/gi,b=/<div[^>]+class="views-field-tid">\s*<a[^>]+href="([^"]+)">/gi,x=/<div class="views-field-phpcode-1">([\S\s]+?)<\/div>(?:\s*<div class="xqjulistwafo">([\S\s]*?)<\/div>)?\s*<div class="views-field-ops">([\S\s]*?)<\/div>/gi,W=/<div[^>]+class="view-content"[^>]*>[\S\s]+?<div[^>]+class="view-footer"[^>]*>/i,L=/<div[^>]+class="view-content"[^>]*>[\S\s]+?<div[^>]+class="item-list"[^>]*>/i,g=/(<span[^>]*>(全文)<\/span>|<[^<>]*>|&nbsp;|\n|\r)+/gi,y=/<span[^>]*>(原创)<\/span>|<[^<>]*>|(&nbsp;|\n|\r)+/gi,T={"本周热门原创":"https://www.juzimi.com/original/week","最新原创句子":"https://www.juzimi.com/original/ju","推荐原创句子":"https://www.juzimi.com/original/recommend"},j={};new ActiveXObject("WScript.Shell").CurrentDirectory=v.GetParentFolderName(WScript.ScriptFullName);try{var M=r(d+"writers").split(/<div[^>]+id="block-block-20"[^>]*>|<div[^>]*>按句子\/名言类别:<\/div>|<div[^>]*>按名言内容类型:<\/div>/);M.shift(),M[2]=/<div[^>]*>[\S\s]*?<\/div>/.exec(M[2])[0]}catch(e){WScript.Quit(5)}f=v.GetSpecialFolder(2).Path+"\\"+encodeURIComponent(d)+".cache";try{for(p=v.OpenTextFile(f,1,!1);!p.AtEndOfStream;)j[p.ReadLine()]=!0;p.Close()}catch(e){}try{p=v.OpenTextFile(f,8,!0)}catch(e){WScript.Echo("Can not write Cache"),WScript.Quit(3)}for(var C=0,O=arguments.length;C<O;++C)if(T[arguments[C]]){if(j[T[arguments[C]]])continue;u=arguments[C]+".txt";try{l=v.OpenTextFile(u,8,!0)}catch(e){s(e,"Opening file "+u);continue}try{c(T[arguments[C]]),p.WriteLine(T[arguments[C]])}catch(e){s(e)}l.Close()}else for(a in M)if(o=RegExp('<a[^>]+href="([^"]+)"[^>]*>'+arguments[C]+"</a>","i").exec(M[a])){if(j[d+o[1]])break;u=arguments[C]+".txt";try{l=v.OpenTextFile(u,8,!0)}catch(e){s(e,"Opening file "+u);continue}try{switch(a){case"0":i(d+o[1]);break;case"1":e(d+o[1]);break;default:t(d+o[1])}p.WriteLine(d+o[1])}catch(e){s(e)}l.Close();break}p.Close(),WScript.Echo("Mission complete.")})("先秦","汉朝","魏晋","南北朝","隋唐五代","宋朝","元朝","明朝","清朝","近现代","美国名人","英国","法国","德国","日本","俄罗斯","希腊","罗马","意大利","奥地利","印度","书籍名句","电影台词","小说摘抄","散文美句","动漫语录","连续剧台词","古文名句","爱情","读书","励志","时间","友情","诚信","爱国","激励","勤奋","奉献","真理","道德","理想","人生","数学","英语","母爱","劳动","亲情","创新","团结","童年","感恩","目标","本周热门原创","最新原创句子","推荐原创句子");
复制代码
1

评分人数

TOP

回复 2# flashercs
第一个就停了。
然后,想把喜欢及其数字,抓到最前面,或者最后面。方便处理成一条。谢谢!国庆节快乐!

TOP

访问多了那网站就不让访问了,403错误,服务器拒绝服务,请更换IP地址才行。

TOP

回复 4# flashercs
附件: 您需要登录才可以下载或查看附件。没有帐号?注册

TOP

本帖最后由 flashercs 于 2018-10-1 17:44 编辑

回复 5# lxh623


    你试试浏览器还能打开网站吗?

附件: 您需要登录才可以下载或查看附件。没有帐号?注册

TOP

本帖最后由 flashercs 于 2018-10-1 17:49 编辑

回复 5# lxh623


    短时间内大量访问被视为http攻击,人家https服务器拒绝服务,你必须更换IP地址。。。。。
代码已修改 已经添加了 喜欢(18960)

TOP

不知道怎样减缓动作,让服务器不反感呢?谢谢!

TOP

回复 8# lxh623


    延迟一定时间吧,比如每隔10s访问一次网站,就可能没事了,不过下载速度太慢了。。。。。
自己权衡吧。

TOP

本帖最后由 lxh623 于 2018-10-4 10:42 编辑

回复 9# flashercs
脚本里面怎么设置时间?
同时加入清除cookie的功能,行不行?
只抓到一个作者,那么,可以把脚本再细化到作者,不然,每次只有“诗经”。
谢谢!

TOP

回复 10# lxh623


    可以了下很多了 修改了一下

TOP

这个网站太厉害,隔了一天都打不开。

TOP

回复 12# lxh623


    找个代理切换器之类的吧
【扫描二维码捐助论坛的朋友请留言注明论坛账号】http://bbs.bathome.net/thread-10403-1-1.html
【批处理在线视频分享】http://bbs.bathome.net/thread-31727-1-1.html
【微信公众号、微信群、QQ群】http://bbs.bathome.net/thread-3473-1-1.html

TOP

返回列表