找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 17228|回复: 2

[文本处理] 【已解决】求助,bat删除TXT中指定的html标签

[复制链接]
发表于 2022-6-17 11:13:58 | 显示全部楼层 |阅读模式
本帖最后由 cspxvip 于 2022-6-17 14:20 编辑

采集程序采集了很多txt内容,内容举例:
<h2>还贷中的房子能出售吗</h2>
<p>商品房现售,应当符合以下条件:</p>
<p><img src='https://xxxxxxxx.com/it/u=1239053' alt='正在还贷的房子证明出售'></p>
<h2>出售未还完贷款的房屋需要什么手续?</h2>
我想实现删除那个图片链接:(<p><img src='https://xxxxxxxx.com/it/u=1239053' alt='正在还贷的房子证明出售'></p>)
目的是删除内容中的图片,求大佬帮帮忙,谢谢
发表于 2022-6-17 13:04:41 | 显示全部楼层
  1. @echo off
  2. cd /d "%~dp0"
  3. @REM html.txt是 utf8编码
  4. powershell -c "$enc=new-object system.text.utf8encoding $false;gci .\*.txt|foreach-object{[io.file]::writeAllText($_.FullName,([io.file]::ReadAllText($_.FullName) -replace '<p><img[^>]*></p>'),$enc)}"
  5. pause
复制代码
 楼主| 发表于 2022-6-17 14:16:59 | 显示全部楼层
回复 2# flashercs


    谢谢大佬,亲测没问题!!!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-19 20:53 , Processed in 0.017506 second(s), 8 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表