Board logo

标题: [文本处理] 批处理如何读取在线网页GBK编码的网页? [打印本页]

作者: xp3000    时间: 2023-6-6 09:51     标题: 批处理如何读取在线网页GBK编码的网页?

本帖最后由 xp3000 于 2023-6-9 15:31 编辑

网址挂了,代码没有用了,帖子好像删除不了
作者: terse    时间: 2023-6-6 17:28

如果不确定是UTF-8编码或者GBK编码 那就加个判断吧
65行 (crr.length > 26) 这样判断行不行
crr.slice(0, 30) 有时会出现错误 原因不明
作者: xp3000    时间: 2023-6-6 18:09

找到问题了,有的标题只有【完】这类的,.replace后面的正则表达式会把字符串清空
删除就就正常了,现在剩下处理其他网站的GBK编码乱码问题




欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2