Board logo

标题: [其他] 【已解决】dehtml的使用教程或者同类解析网页工具? [打印本页]

作者: ttszuo    时间: 2015-8-27 03:33     标题: 【已解决】dehtml的使用教程或者同类解析网页工具?

本帖最后由 ttszuo 于 2015-8-27 22:17 编辑

解析网页dehtml没有帮助内容,求批处理示例或者带示例的同类工具
作者: CrLf    时间: 2015-8-27 04:11

就是解码出可见部分咯,dehtml --help 可见自带帮助
Usage: dehtml [-w] [-s] [-l] [-p] [-u] [file ...]

Remove HTML constructs from documents.

-w, --word-list     output a word list
-s, --skip-headers  do not output headers
-l, --skip-lists    do not output lists
-p, --pretty-print  pretty printed output
-u, --urls          do not output URLs in tag attributes
-h, --help          display this help and exit
    --version       display version and exit

不过试了下效果不大好,尤其是不支持中文
同类第三方可以试试 html2text,或用 js 或 vbs 实现
作者: DAIC    时间: 2015-8-27 09:07

http://bbs.bathome.net/thread-1974-1-1.html
试试这个




欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2