[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

用fr或sed替换html中中文内容引起的乱码求助

  1. sed.exe -ri "s/<title>.*<\/title>/<title>这是一个测试<\/title>/g" index.html
  2. fr.exe \vtour\aaa.xml -r:<title>.*<\/title> -t:title=<title>这是一个测试<\/title>
复制代码
这种替换会导致html文件内<title> 和<\/title>中间的部分乱码。
因为html和xml都是utf-8的编码。
请问我如何处理能让内容正常在网页上显示?
我没办法声明编码格式呀

在win下使用 sed 要注意 网页的编码 是否为 utf-8,当是这种编码的要转换为 ansi。
  1. for /f %%g in ('dir /b/on *.*htm*') do (
  2. iconv -c -f utf-8 -t gb2312 "%%g" >"gb%%g"
  3. move /y "gb%%g" "%%g">nul
  4. )
复制代码
然后
  1. sed -i "s/aa/bb/g" "index.html"
复制代码
基本不会错
目的,学习批处理

TOP

本帖最后由 siang 于 2017-6-19 18:32 编辑

fr可以指定输入输出编码,制作者有好几个字符串查找替换命令行工具
  1. fr.exe \vtour\aaa.xml "/encin:utf-8 /encout:utf -r:<title>.*<\/title> -t:title=<title>这是一个测试<\/title> -frc
复制代码
sed我win下命令行选项看的不太懂 不如Linux下的教程说明多

TOP

返回列表