[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖
不会用Python,查了挺久,乱凑出来…
  1. import re
  2. from urllib import request
  3. import os
  4. from pprint import pprint
  5. from time import sleep
  6. url_imgs = 'http://img.xgyw.cc/'
  7. url_root = 'http://www.xgyw.cc'
  8. url_find = url_root + '/neiyiyouwu/neiyiyouwu2035.html'
  9. path_save = '.'
  10. try:
  11. txt=request.urlopen(url_find).read().decode("gbk")
  12. rs_page=re.findall(r'''(/(\w+)/(\2)\d+_?\d*.html)''',txt)
  13. print('\n### rs_page::\n', rs_page)
  14. except:
  15. sleep(1)
  16. pass
  17. nPage = 0
  18. for x in rs_page:
  19. nPage += 1
  20. url_page = url_root + x[0]
  21. try:
  22. html=request.urlopen(url_page).read().decode("gbk")
  23. rs_img=re.findall('''src=\"(/uploadfile.*?\d+/\w+\.jpg)\"''',html)
  24. print('\n### Page:' + str(nPage) + '/' + str(len(rs_page)))
  25. print('\t### ' + url_page)
  26. except:
  27. sleep(1)
  28. nImgs = 0
  29. for h in rs_img:
  30. nImgs += 1
  31. fn = os.path.basename(h)
  32. dp = os.path.basename(url_find)
  33. #dp = url_find[url_find.rfind('/')+1:]
  34. dp = path_save + '/' + dp[:dp.rfind('.')]
  35. if (os.path.exists(dp) == False) : os.makedirs(dp) #建立文件夹
  36. ff = (dp + '/' + fn).replace('/', '\\')
  37. url_img = url_imgs + h
  38. print('\n### Page:' + str(nPage) + '/' + str(len(rs_page)), '\tImgs:' + str(nImgs) + '/' + str(len(rs_img)))
  39. print('\t### ' + url_page)
  40. print('\t###   ', url_img)
  41. print('\t### ->', ff)
  42. try:
  43. if (os.path.exists(ff) == False):
  44. print('\t### Download ...')
  45. request.urlretrieve(url_img, ff)
  46. print('\t\t### [OK]')
  47. else:
  48. print('\t### [EXIST]')
  49. except:
  50. print('\t\t### Error:0x3')
  51. sleep(1)
  52. print('\n### Done.')
复制代码
1

评分人数

『千江有水千江月』千江有水,月映千江;万里无云,万里青天。    http://yu2n.qiniudn.com/

TOP

返回列表