Board logo

标题: [文件操作] xdoc2txt - 转换 doc/xls/pdf/html... 为 txt [打印本页]

作者: tmplinshi    时间: 2013-1-30 17:17     标题: xdoc2txt - 转换 doc/xls/pdf/html... 为 txt

xdoc2txt 不依赖于 Office。

Usage: xdoc2txt [-s|-e|-j|-u|-8][-f][-p] <filename...>
        -s : convert to ShiftJIS(default)
        -e : convert to EUC
        -j : convert to JIS
        -u : convert to UTF16(LE)
        -8 : convert to UTF8
        -f : output to file
        -p : print property
        -r=(0|1|2) : ruby style(0:suppress 1:parentheses 2:aozora bunko
        -o=0 : other option; -o=0:no show PDF page#
        -g=# : PDF gap parameter
        -v : show version number
        -x : output existing cell only(for EXCEL2007)
        -i : use IFilter, if possible


示例:
  1. xdoc2txt.exe -8 -f *.doc *.xls
复制代码
----------------------------------------------
官网: http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.html
----------------------------------------------
http://bcn.bathome.net/s/tool/index.html?key=xdoc2txt
作者: BAT-VBS    时间: 2013-1-30 20:05

感谢分享
作者: 小河都江堰    时间: 2013-1-30 20:47

谢谢分享,我收藏了
作者: Clarkky    时间: 2013-1-31 09:50

为什么所有README.txt都是乱码?
作者: tmplinshi    时间: 2013-1-31 12:30

本帖最后由 tmplinshi 于 2013-1-31 12:33 编辑

回复 4# Clarkky


是日文的。记事本似乎不能用日文编码 Shift-JIS 打开 txt。

试试其他的编辑器,如 AkelPad。


作者: h2bx86    时间: 2013-2-16 14:18

正好需要,谢谢了,。。
作者: sunhangmail    时间: 2013-5-24 23:39

谢谢,好用,但是好像打开excel文档会乱码,word和pdf可以使用
作者: tmplinshi    时间: 2013-5-24 23:57

回复 7# sunhangmail


试试这样:
  1. xdoc2txt -8 "test.xls" | win_iconv -c -f utf-8 -t gbk
复制代码
win_iconv (http://bathome.net/thread-19842-1-1.html)
作者: sunhangmail    时间: 2014-4-5 18:15

回复 8# tmplinshi


    谢谢,还是不行,依然乱码,到这个xdoc2txt的日本官网下载最新版本依然不行,只能支持doc和pdf等文件。
作者: 1e3e    时间: 2014-5-21 09:00

转换后为什么对数值全部取整数???




欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2