找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 107281|回复: 22

[文本处理] 批处理从多个文件中读取这两行之间的内容如何提高效率?

[复制链接]
发表于 2019-1-16 17:42:39 | 显示全部楼层 |阅读模式
本帖最后由 soarhu 于 2019-1-17 13:03 编辑

现在有10个文件(名字:file_name_c1, file_name_c2,....,file_name_c10 ),每个文件size大概为1M ~ 50M。
每个文件都包含这两行,
其中一行包含   BUFFER POOL AND
另外一行包含    DATABASE USAGE
从这些文件中读取这两行之间的内容,添加一行文字来作为分隔,另存为一个新文件。
我根据帮助文档和bathome.net写了一个批处理,能够运行,
目前的问题效率较低(现在需要5分钟时间),不知诸位有何建议来改进提高效率,提前谢谢诸位的关注和帮助,欢迎点评和建议!
  1. @echo off on & setlocal enabledelayedexpansion
  2. cls
  3. set new_name=newf01
  4.        
  5. for /L %%i in (1,1,10) do (
  6.         set /a cc_i=%%i
  7.         call :next !cc_i!  
  8. )
  9. goto :eof
  10. :next
  11. @echo off
  12. set file_name=pf_s%1.f01
  13. for /F " delims=" %%i in (%file_name%) do (
  14.                 set "s=%%i"
  15.                 if not "!s:BUFFER POOL AND=!" == "!s!" (set flag=) else if defined flag echo;!s!>>%new_name%.txt
  16.                 if not "!s:DATABASE USAGE=!" == "!s!" set "flag=1"   
  17.                 if not "!s:DATABASE USAGE=!" == "!s!" echo ---%~dp0 --- %file_name% --- %date% --- >>%new_name%.txt  
  18. )
复制代码
编辑添加 goto :eof


希望生成的新文件格式如下:

---file_path--- file_name1 --- date ---  
text between line_keyword_a and line_keyword_b  in file1  
---file_path--- file_name2--- date ---  
text between line_keyword_a and line_keyword_b  in file2  
---file_path--- file_name3--- date ---  
text between line_keyword_a and line_keyword_b  in file3
...
...
...
---file_path--- file_name10--- date ---  
text between line_keyword_a and line_keyword_b  in file10
 楼主| 发表于 2019-1-16 17:55:45 | 显示全部楼层
稍微修改一下,在第九行之后和:next之前添加一行
goto :eof
发表于 2019-1-16 20:44:20 | 显示全部楼层
试试这样需要几分钟:
  1. @echo off
  2. setlocal enabledelayedexpansion
  3. set "new_name=newf01"

  4. for /l %%i in (1,1,10) do (
  5.     set cc_i=%%i
  6.     call :next !cc_i!
  7. )
  8. goto :eof

  9. :next
  10. set file_name=pf_s%1.f01
  11. (for /f "delims=" %%i in (%file_name%) do (
  12.     set "s=%%i"
  13.     if not "!s:BUFFER POOL AND=!" == "!s!" (
  14.         set flag=
  15.     ) else if defined flag (
  16.         echo,!s!
  17.     )
  18.     if not "!s:DATABASE USAGE=!" == "!s!" (
  19.         set "flag=1"
  20.     )
  21.     if not "!s:DATABASE USAGE=!" == "!s!" (
  22.         echo ---%~dp0 --- %file_name% --- %date% ---
  23.     )
  24. ))>>"%new_name%.txt"
复制代码

评分

参与人数 1技术 +1 收起 理由
soarhu + 1 极大地提高了效率!++赞👍

查看全部评分

发表于 2019-1-16 20:46:20 | 显示全部楼层
回复 2# soarhu


    可以点击楼层左下角的“编辑”
发表于 2019-1-16 22:06:29 | 显示全部楼层

更新

本帖最后由 yhcfsr 于 2019-1-16 23:45 编辑
  1. @echo off
  2. set "new_name=newf01.txt"

  3. for /L %%i in (1,1,10) do if exist "pf_s%%i.f01" call :next "pf_s%%i.f01"
  4. pause&exit
  5. :next
  6. setlocal enabledelayedexpansion
  7. (for /F "delims=" %%i in ('type "%~1"') do (
  8.     set "str=%%i"
  9.         if "!str:DATABASE USAGE=!" neq "!str!" goto :break
  10.         if "!str:BUFFER POOL AND=!" neq "!str!" (set "begin=1") else if defined begin echo;!str!
  11. ))>>"%new_name%"
  12. :break
  13. endlocal
复制代码
发表于 2019-1-16 22:23:56 | 显示全部楼层
回复 5# yhcfsr


    如果文件中存在 ! 符号,会被丢弃!!!

评分

参与人数 1PB +6 收起 理由
523066680 + 6 你不是人造革,你是真的皮

查看全部评分

发表于 2019-1-16 22:50:00 | 显示全部楼层
本帖最后由 yhcfsr 于 2019-1-16 22:51 编辑

回复 6# WHY

题主都说这么用可以实现,只是差点效率.所以我也就偷懒了.
如果要避免!号的问题,我看只能混编了
 楼主| 发表于 2019-1-16 22:58:33 | 显示全部楼层
本帖最后由 soarhu 于 2019-1-16 23:01 编辑

回复 3# Batcher

非常感谢Batch的关注和热心回复,
经过单次测试,好消息是新的Batcher大概快一分钟。

有个问题,只输出了最后一个的内容。可能是哪里有些许问题。

再次感谢!

Batcher
 楼主| 发表于 2019-1-16 23:04:56 | 显示全部楼层
回复 6# WHY

非常感谢指出这个问题!
目前,!不是问题。需要提取的内容当中不包含符号!
可能有*** ---- 等符号。

感谢Bahome高手热心指点!
 楼主| 发表于 2019-1-16 23:28:49 | 显示全部楼层
回复 5# yhcfsr


这一改进简单测试,不可运行,提示错误
The filename, directory name, or volume label syntax is incorrect.
我认为可能是我的目录中含有下划线的原因。
但是放到没有特殊字符的目录下,有同样的错误出现。暂时未能运行。如果了解原因,请告知,

谢谢你对这一问题的关注和热心回复。
 楼主| 发表于 2019-1-16 23:29:44 | 显示全部楼层
回复 4# Batcher


嗯,    谢谢,已经改正
发表于 2019-1-16 23:30:30 | 显示全部楼层
回复 8# soarhu


    请详细说明一下“只输出了最后一个的内容”
发表于 2019-1-16 23:47:52 | 显示全部楼层
本帖最后由 yhcfsr 于 2019-1-16 23:49 编辑

回复 10# soarhu
5楼代码我稍微改了下,根据实际情况,修改第4行两处引号内与文件名相关的地方.
  1. @echo off
  2. set "new_name=newf01.txt"

  3. for /L %%i in (1,1,10) do if exist "pf_s%%i.f01" call :next "pf_s%%i.f01"
  4. pause&exit
  5. :next
  6. setlocal enabledelayedexpansion
  7. (for /F "delims=" %%i in ('type "%~1"') do (
  8.     set "str=%%i"
  9.         if "!str:DATABASE USAGE=!" neq "!str!" goto :break
  10.         if "!str:BUFFER POOL AND=!" neq "!str!" (set "begin=1") else if defined begin echo;!str!
  11. ))>>"%new_name%"
  12. :break
  13. endlocal
复制代码
 楼主| 发表于 2019-1-17 12:52:18 | 显示全部楼层
本帖最后由 soarhu 于 2019-1-17 13:04 编辑

回复 12# Batcher


前面的文件都没有输出,最后仅输出了最后一个文件的两行之间的内容。
嗯,具体原因稍晚我会再研究一下。如果有新发现,请告知。谢谢

---file_path--- file_name10--- date ---  
text between line_keyword_a and line_keyword_b  in file10
 楼主| 发表于 2019-1-17 12:53:03 | 显示全部楼层
回复 13# yhcfsr


嗯,感谢小修改,稍晚我会试一下。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-19 00:02 , Processed in 0.022514 second(s), 8 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表