批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程
[批处理文件精品]批处理版照片整理器[批处理文件精品]纯批处理备份&还原驱动在线第三方下载
返回列表 发帖

[文本处理] [已解决]批处理如何大量指定删除和正规表达替换?

本帖最后由 bankouyan 于 2020-3-28 02:41 编辑

原文格式:

《明风八万里》
作者:紫钗恨
内容简介:
    1644年的金陵残照与越明中兴,且看我只手再造乾坤

第一章 诚意伯府
    “正文”

第二章 托梦
    “正文”

第三章 枣桃
    “正文”

想实现效果如下:

###第一章 诚意伯府
    “正文”

###第二章 托梦
    “正文”

###第三章 枣桃
    “正文”

###     <----这个是在文本最后一行加入

PS:txt文件的大小不一,有些几十M,有些小几M,而且是大量的txt
  1. @ECHO OFF
  2. SET TxtDir="C:\Users\Administrator\Desktop\新建文件夹\新建文件夹 (2)"
  3. SET /A N=5
  4. ECHO 开始操作,请稍后...
  5. CD /D %TxtDir%
  6. ::.txt为文件类型
  7. FOR /F "tokens=1 delims=" %%I IN ('DIR /A /B *.txt') DO ((MORE +%N% "%%I">"%%I_")&(DEL /A /F /Q "%%I")&(REN "%%I_" "%%I"))
  8. ECHO 操作结束
  9. PAUSE
复制代码
目前有以上脚本删除以下内容,用删除前几行的方法,但是效果不怎么好! (单文件处理效果还行,多文件就不行了.)
《明风八万里》
作者:紫钗恨
内容简介:
    1644年的金陵残照与越明中兴,且看我只手再造乾坤

第一章替换成  ###第一章 的正规表达
(第[零一二三四五六七八九十百千万两|0-9]*[章回节])
###$1

试过用findstr,没成功

能对这几百个文件一次性处理。谢谢各位老师。

建议用python处理这样复杂的东西。

TOP

本帖最后由 netdzb 于 2020-3-27 10:30 编辑

回复 1# bankouyan

我没看出来你用什么语法匹配 第* 章的语法。
python的中文匹配我也不会,一起学习一下。

TOP

回复 3# netdzb
用Notepad++这个软件正规表达可以批量处理第*章但是要手动!

TOP

回复 2# netdzb

python不会写,反而会一点点shell脚本,但是只能处理单个文件,不懂得批量.

TOP

回复 5# bankouyan


你能把这个正则搞定吗?

#!/usr/bin/python
# -*- coding: UTF-8 -*-

import re
str = '''TITLE "Leslie Cheung 张国荣 LPCD45"
PERFORMER "张国荣"
REM DATE "2008"
REM DISCID E3103E10
FILE "Leslie Cheung 张国荣 LPCD45.flac" WAVE
  TRACK 01 AUDIO
    TITLE "奔向未来日子"
    PERFORMER "张都荣"
    REM COMMENT "[www.pt80.net]"
    INDEX 01 00:00:00'''
print re.sub('张*荣','图片',str)

我想把张国荣,张都荣替换成图片,运行后并没有替换。
这个问题搞定了,你的问题也搞定一半了。

TOP

回复  bankouyan


你能把这个正则搞定吗?

#!/usr/bin/python
# -*- coding: UTF-8 -*-

import  ...
netdzb 发表于 2020-3-27 14:15



张国荣  (包含英文名+数字+中文混合)
正规表达
[A-Za-z0-9_\-\u4e00-\u9fa5]+

图片  带有网址路径
正规表达
[a-zA-z]+://[^\s]*

TOP

回复 7# bankouyan

python2好像跑步通,python3还没用过,有空试验一下。

TOP

返回列表