找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 11702|回复: 4

[文本处理] [已解决]批量提取文本里面的png图片链接并输出到新的文本中?

[复制链接]
发表于 2024-8-10 13:29:51 | 显示全部楼层 |阅读模式
本帖最后由 a574045075 于 2024-8-10 14:34 编辑
  1. src="https://cdn.wikimg.net/en/zeldawiki/images/thumb/a/ab/Aftermath.png/120px-Aftermath.png" decoding="async" loading="lazy" width="120" height="103" srcset="//cdn.wikimg.net/en/zeldawiki/images/thumb/a/ab/Aftermath.png/180px-Aftermath.png 1.5x, //cdn.wikimg.net/en/zeldawiki/images/thumb/a/ab/Aftermath.png/240px-Aftermath.png 2x" /></a></span></div>
  2.                         <div class="gallerytext">
  3. <a href="/wiki/File:Aftermath.png" class="galleryfilename galleryfilename-truncate" title="File:Aftermath.png">Aftermath.png</a>
  4. 400 × 344; 142 KB<br />

  5.                         </div>
  6.                 </li>
  7.                 <li class="gallerybox" style="width: 155px">
  8.                         <div class="thumb" style="width: 150px; height: 150px;"><span typeof="mw:File"><a href="/wiki/File:Fishing_Hook_Screenshot.png" class="mw-file-description"><img alt="" src="https://cdn.wikimg.net/en/zeldawiki/images/thumb/8/8a/Fishing_Hook_Screenshot.png/120px-Fishing_Hook_Screenshot.png" decoding="async" loading="lazy" width="120" height="96" srcset="//cdn.wikimg.net/en/zeldawiki/images/8/8a/Fishing_Hook_Screenshot.png 1.5x" /></a></span></div>
  9.                         <div class="gallerytext">
  10. <a href="/wiki/File:Fishing_Hook_Screenshot.png" class="galleryfilename galleryfilename-truncate" title="File:Fishing Hook Screenshot.png">Fishing Hook Screenshot.png</a>
  11. 160 × 128; 2 KB<br />
复制代码
如何把上面代码里面的图片链接批量提取并输出到新文本中?
结果如下
  1. https://cdn.wikimg.net/en/zeldawiki/images/thumb/a/ab/Aftermath.png/120px-Aftermath.png
  2. https://cdn.wikimg.net/en/zeldawiki/images/thumb/8/8a/Fishing_Hook_Screenshot.png/120px-Fishing_Hook_Screenshot.png
复制代码

评分

参与人数 1PB +2 收起 理由
Batcher + 2 感谢给帖子标题标注[已解决]字样

查看全部评分

发表于 2024-8-10 13:48:49 | 显示全部楼层
http://bcn.bathome.net/s/tool/index.html?down&key=sedsed下载
  1. chcp 65001  是否需要根据调试
  2. sed -i "s/http/\nhttp/g;s/png"/png\n/g" test.txt
  3. chcp 936  是否需要根据调试
  4. findstr /i "https" test.txt|findstr -i "png">>test2.txt
复制代码
是否需要保存为ansi格式的bat,需实际测试确定。
如上 ,现状我系统win11,这些调试比较头疼。

评分

参与人数 1技术 +1 收起 理由
a574045075 + 1 谢谢了

查看全部评分

发表于 2024-8-10 14:26:48 | 显示全部楼层
本帖最后由 aloha20200628 于 2024-8-10 14:31 编辑

回复 1# a574045075


  1. @echo off &(for /f "delims=" %%a in ('findstr /ic:"src=" 1.xml') do (
  2.         set "s=%%a"&setlocal enabledelayedexpansion
  3.         for /f tokens^=2^delims^=^" %%v in ("!s:*src=!") do echo,%%v
  4.         endlocal
  5. ))>1.txt
  6. pause&exit/b
复制代码

评分

参与人数 1技术 +1 收起 理由
a574045075 + 1 谢谢

查看全部评分

 楼主| 发表于 2024-8-10 14:36:13 | 显示全部楼层
回复 2# hlzj88


    谢谢! win7测试通过.
发表于 2024-8-10 15:18:53 | 显示全部楼层
http://bcn.bathome.net/tool/3.0/grep.exe
  1. grep -Po "(?<=src=\x22)https?[^\x22]+(?=\x22)" a.txt | find /v "" > b.txt
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-17 21:04 , Processed in 0.021879 second(s), 8 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表