找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 25201|回复: 3

[文本处理] [已解决]批处理有没有快速高效的方法实现一字一行?

[复制链接]
发表于 2015-4-11 08:46:12 | 显示全部楼层 |阅读模式
本帖最后由 每天几分 于 2015-4-12 15:34 编辑

我想统计一些网络小说的字频情况,但由于网络小说都是几MB以上的大段文字,用录制宏、或正则([\u4e00-\u9fa5])替换$1\r\n实现一字一行非常缓慢,请问批处理有没有快速高效的方法实现一字一行?

评分

参与人数 1PB +2 收起 理由
Batcher + 2 感谢给帖子标题标注[已解决]字样

查看全部评分

发表于 2015-4-11 15:10:22 | 显示全部楼层
本帖最后由 pcl_test 于 2015-4-12 22:44 编辑

1M大小的文本用时1分10秒±
  1. @echo off
  2. setlocal enabledelayedexpansion
  3. (for /f "delims=" %%a in ('type "测试.txt"') do (
  4. set "str=%%a"
  5. set "str=!str: =!"
  6. set "str=!str:  =!"
  7. for %%b in (! , 。 ? “ ” : ; 《 》 …… - —— 、 ( ) ‘ ’) do set "str=!str:%%b=!"
  8. set "$=!str!#"
  9. set len=&for %%z in (4096 2048 1024 512 256 128 64 32 16) do if !$:~%%z^,1!. neq . set/a len+=%%z&set $=!$:~%%z!
  10. set $=!$!fedcba9876543210 & set/a len+=0x!$:~16,1! &set/a len-=1
  11. for /l %%i in (0 1 !len!) do echo,!str:~%%i,1!
  12. ))>"结果.txt"
  13. pause
复制代码
发表于 2015-4-11 17:14:57 | 显示全部楼层
本帖最后由 pcl_test 于 2015-5-10 10:54 编辑

vbs 1M大小的文本用时8秒±
  1. Dim fso,File1,File2
  2. Set fso = CreateObject("Scripting.FileSystemObject")
  3. Set Reg = CreateObject("vbscript.Regexp")
  4. Set File1= fso.OpenTextFile(".\测试.txt", 1 , True)
  5. Set File2 = fso.CreateTextFile(".\结果.txt", 2 ,False)  
  6. Do While File1.AtEndOfStream <> True
  7.     str=File1.ReadLine
  8.     Reg.Global = True
  9.     Reg.Pattern = "[^a-zA-Z0-9\u4E00-\u9FA5]"
  10.     str = Reg.Replace(str, "")
  11.     For i=1 to len(str)
  12.     word=mid(str,i,1)
  13.     File2.WriteLine word
  14.     Next
  15. loop
  16. File1.Close
  17. File2.Close
  18. MsgBox "完成!"
复制代码

评分

参与人数 1技术 +1 收起 理由
每天几分 + 1 很好,谢谢!

查看全部评分

发表于 2015-4-11 17:28:18 | 显示全部楼层
js 的 text.split('').jion('\r\n') 就很好用了,replace 也可
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-19 05:22 , Processed in 0.024358 second(s), 9 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表