Board logo

标题: 【完成】50元求文本处理 [打印本页]

作者: lxh623    时间: 2021-4-11 10:21     标题: 【完成】50元求文本处理

本帖最后由 lxh623 于 2021-4-14 10:37 编辑

文本是utf8格式,文件夹下有十个。
每一行有1-1000个\t【,我想,依序加入序号(1-1000)。
就是形如,\t1.【等等。
谢谢!
作者: netdzb    时间: 2021-4-11 10:58

回复 1# lxh623

能把示范文件发上来吗?
作者: zaqmlp    时间: 2021-4-11 11:42

本帖最后由 zaqmlp 于 2021-4-11 13:34 编辑
  1. <# :
  2. cls
  3. @echo off
  4. rem 存为ANSI编码的bat
  5. cd /d "%~dp0"
  6. powershell -NoProfile -ExecutionPolicy bypass "Invoke-Command -ScriptBlock ([ScriptBlock]::Create([IO.File]::ReadAllText('%~f0',[Text.Encoding]::GetEncoding('GB2312')))) -Args '%~f0'"
  7. pause
  8. exit
  9. #>
  10. $self=get-item -liter $args[0];
  11. $path=$self.Directory.FullName;
  12. $enc=New-Object System.Text.UTF8Encoding $False;
  13. $files=@(dir -liter $path -recurse|?{('.txt' -eq $_.Extension) -and ($_ -is [System.IO.FileInfo])});
  14. for($i=0;$i -lt $files.length;$i++){
  15.     write-host $files[$i].FullName.substring($path.length);
  16.     $arr=New-Object -TypeName System.Collections.ArrayList;
  17.     $text=[IO.File]::ReadAllLines($files[$i].FullName,$enc);
  18.     for($j=0;$j -lt $text.count;$j++){
  19.         $global:n=1;
  20.         $line=[regex]::replace($text[$j],'\t【',{
  21.             param($m);
  22.             $m.groups[0].value -replace '(?=【)',(($global:n).toString()+'.');
  23.             $global:n++;
  24.         });
  25.         [void]$arr.add($line);
  26.     }
  27.     [IO.File]::WriteAllLines($files[$i].FullName,$arr,$enc);
  28. }
复制代码

作者: lxh623    时间: 2021-4-11 13:20

链接:https://pan.baidu.com/s/1FtuPoMYgEqv1ywrbrl2Dhw
提取码:ovoj

谢谢!
作者: netdzb    时间: 2021-4-11 14:36

本帖最后由 netdzb 于 2021-4-11 14:39 编辑

回复 1# lxh623

你是想实现/t1,/t2,/t3......这样一直下去吗?

搜索你的文件没有看到/t,一共13行对吧。
作者: xczxczxcz    时间: 2021-4-11 14:43

本帖最后由 xczxczxcz 于 2021-4-11 16:38 编辑

https://pan.baidu.com/s/1lN1q-Zc2gFa44Kz3t3vk9w
sn: [ofh7]
论坛不能上传文件

下面的是按行添加序号,每行从1 开始.
https://pan.baidu.com/s/1mJ4dSWIz1oEhc4PLf5sNXw
sn: [8rs3]
作者: qixiaobin0715    时间: 2021-4-11 16:02

回复 5# netdzb
老外了,/t就是制表符了。
作者: netdzb    时间: 2021-4-11 16:23

回复 7# qixiaobin0715

我知道/t是制表符号,但他描述的时候是否可以尽量详细一些呢?
作者: lxh623    时间: 2021-4-13 11:49

没有满意的答案,取消了。
作者: netdzb    时间: 2021-4-13 12:20

回复 9# lxh623

自己动手丰衣足食,慢慢学习论坛教程吧。批处理我也算是入门了啊。
作者: zaqmlp    时间: 2021-4-13 12:58

本帖最后由 zaqmlp 于 2021-4-13 13:05 编辑

回复 9# lxh623


    哪里不满意,说出来看看,有什么问题也没反馈,让人怎么改?消失多日,直接取消,让人白写吗
作者: Gin_Q    时间: 2021-4-13 13:53

回复 11# zaqmlp


    被白嫖了吗?
作者: lxh623    时间: 2021-4-14 10:38

非常好。
本来第一次不行,我也已经放弃,但是,有个新的想法,还是想做。于是又来试一试。
3.7G的文件,居然很快搞定。
谢谢!
请查收。




欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2