找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 11510|回复: 0

[问题求助] Python如何提取网页上的md5数值

[复制链接]
发表于 2021-1-17 12:41:20 | 显示全部楼层 |阅读模式
# -*- coding: UTF-8 -*-
import requests
r = requests.get('http://yimuhe.com/file-4830434.html')
r.encoding='utf-8'
print(r.text)


下面是r.txt的部分内容,如何把
<div class="md5">MD5:9a61e37cc886a327928045ebf6a14610</div>
<div class="sha1">SHA1:35c3acb56e4b7749370426e9679da4ac23b5e70b</div>
上的md5数据给提取出来,最好是用标准一点的方法,不要使用正则表达式。
提取的字符串赋值给一个新的字符串。


<div class="l w630">

        <h1>05. Kiss The Rain - Yiruma</h1>

    <div class="info">

        <span>上传用户:</span><span><a href="http://netdzb.yimuhe.com/">netdzb</a></span><span>文件大小:</span><span class="rightnone">15.77MB</span>

        <span>文件类型:</span><span>flac</span><span>下载次数:</span><span class="rightnone"><img src="/n_images/z1.gif" />&nbsp;</span>

        <span>上传日期:</span><span>2021-01-03 07:45:16</span><span>用户收入:</span><span class="rightnone">保密  <a href="/n_money.html" target="_blank"><font color="#FF0000">想赚钱吗?</font></a></span>

            <div class="md5">MD5:9a61e37cc886a327928045ebf6a14610</div><div class="sha1">SHA1:35c3acb56e4b7749370426e9679da4ac23b5e70b</div>

    </div>

        

    <div class="caocuo">

        <span class="soucang"><A href="javascript:window.external.AddFavorite('http://www.yimuhe.com/file-4830434.html','05. Kiss The Rain - Yiruma.flac');">收藏文件</A></span>

        <span class="jubao"><a onclick="jubao_file(4830434,'netdzb');" href="javascript:;">举报文件</a></span>

        <span><a href="down-4830434.html"><font color="#FF0000">下载文件</font></a></span>



    </div>

......
</div>
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-17 03:36 , Processed in 0.015376 second(s), 8 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表