找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 17598|回复: 1

[文本处理] 抽取网页源代码中的文本内容

[复制链接]
发表于 2021-11-9 21:28:11 | 显示全部楼层 |阅读模式
平时浏览网页时,可以用右键“查看网页源代码”,保存为一个文本文件。
需求:
将这个网页源代码文件中所有的HTML代码全部清除,只保留其中的真正的内容文本,最好能保持内容的原排版格式。

谢谢大家一起分析研究和帮助指导!!
发表于 2021-11-9 21:58:48 | 显示全部楼层
回复 1# locoman


试试这个命令行工具:HtoX32c
http://bbs.bathome.net/thread-1974-1-1.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-21 00:05 , Processed in 0.028672 second(s), 17 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表