找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
楼主: 377563714

[文本处理] 批处理如何批量删除多个UTF-8编码的文本内的指定字符串(<>之间的内容)?

[复制链接]
发表于 2013-11-4 21:44:30 | 显示全部楼层
发表于 2016-4-1 22:46:45 | 显示全部楼层

  1. fr *.trc -s -r:"<\d*>" /t:""
  2. fr *.trc -s -r:"\n" /t:"\r\n"
复制代码
发表于 2016-4-2 07:28:06 | 显示全部楼层
这个BAT+JS混编可以,我只能处理单个的不会批量,看看群里高手怎么写吧,要不然把原来帖子删除,取重点重发帖子一次

第一次正则表达式提取
(?=[一-龥\((]).{1,}([一-龥a-zA-Z,,!!\r\n]|\)))|(\d+<\d+>年)?(\d+<\d+>月)?(\d+<\d+>日)?
保存为TXT
第二次正则表达式替换
[\[ \]]|(<\d+>)
替换值为空白

处理成下面的状态,歌词之间原本有空格的没了感觉很奇怪

寂寞在唱歌
阿桑
天黑了孤独又慢慢割着
有人的心又开始疼了
爱很远了很久没再见了
就这样竟然也能活着
你听寂寞在唱歌
轻轻的恨恨的
歌声是这么残忍
让人忍不住泪流成河
......
发表于 2016-8-14 20:45:16 | 显示全部楼层
  1. @echo off
  2. more +4 "%0" | mshta http://bathome.net/s/hta/ "eval(WSH.StdIn.ReadAll())"
  3. pause&exit

  4. dir().files().grep(/\.trc$/i)._each(
  5.     function(file){
  6.         bin=iconv.load(file);
  7.         bom=iconv.checkBom(bin);
  8.         if(bom=='undefined')bom=iconv.toStr(bin,'gb2312')?'gb2312':'utf-8';
  9.         text=iconv.toStr(bin,bom);
  10.         text=text.replace(/<[^<]*>/g,'');
  11.         iconv.saveText(text,'New_'+file,bom)
  12.     }
  13. )
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-17 17:01 , Processed in 0.017122 second(s), 7 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表