[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[问题求助] PowerShell提取txt中的数字后对比csv中的序号所在列,然后导出新csv文件

遇到一个新的问题, 期待高手能帮忙, 提前感谢!
具体描述如下:
1.有一个名为A.csv文件内容如下:
序号,语言,歌手,歌名
1,国语,付雪,金玉良缘
2,国语,阿吉太组合,阿衣莫
3,国语,洛先生,孤城
4,国语,刘艺雯,听闻远方有你
5,国语,海来阿木,五十年以后
6,国语,海来阿木,浮生记
7,国语,杨小壮,最后的人
8,国语,莫叫姐姐,你能不能不要离开我 (莫叫语版)
9,国语,郁可唯,路过人间


2.有一个主文件夹B  其下包含很多文件和子文件夹

3.在B下的有些txt文件的文件名中, 可能包含文字 【歌手】 或 【歌名】

4.只关注文件名包含 【歌手】 或 【歌名】 文字的txt文件, 其内容中,某行可能包含某个数字,只关注1位至4位的数字

需要:
A.csv文件的序号这一列, 如果包含上面提到的1位或4位数字,  则将该序号所在的行, 另存到C.csv文件中

需要注意的是:
有些数字可能会重复,那就只算一个
C.csv文件中首行要有A.csv文件的首行标题
C.csv文件中的第二行至结尾行按第一行的序号升序排列

回复 26# 5i365


    $b改成$a还是放在原来的地方

TOP

回复 26# 5i365


    23楼的, 22,23行清空已筛选的的txt文件代码, 加在哪里?

TOP

本帖最后由 idwma 于 2022-1-22 00:13 编辑

回复 24# 5i365
  1. #@&cls&powershell -version 2.0 "type '%~0'|out-string|iex"&pause&exit
  2. #$r='^(\d+).*' #1
  3. $r='^\D+(\d+)\D' #2
  4. #$r='\D+(\d+)$' #3
  5. $a=@{}
  6. $f=gc 歌单.csv -Encoding UTF8
  7. $f|%{
  8.     $z=$_ -replace '^(\d+).*','$1'
  9.     if (!($a.ContainsKey($z))){$a.$z=$_}
  10. }
  11. $d=@{}
  12. dir ".\任务" -recu * -inc *原唱*.txt,*伴奏*.txt,*歌词*.txt|%{
  13.     if($_ -match '(原唱|伴奏|歌词)'){$c=$($_.fullname -replace '^.*?([^\\]*)\\[^\\]*$','$1')+'_'+$Matches[0]}
  14.     foreach($i in gc $_){
  15.         if($i -match $r){
  16.             $z=$matches[1]
  17.             if($a.ContainsKey($z)){$d[$c]+=@($a.$z)}
  18.         }
  19.     }
  20. }
  21. $d.keys|%{sc -Encoding UTF8 $($_+'.csv') ($f[0],($d.$_|sort{[int]($_ -split ',')[0]}))}
复制代码

TOP

本帖最后由 5i365 于 2022-1-21 19:09 编辑

回复 23# idwma


    刚试了一下, 第一条OK了, 下面这条没有
txt文件, 可能在不同的文件夹中, 想在导出的csv文件名前,加上其所在的文件夹名
例如导出的   歌词.csv  文件, 他是筛选的 1号 文件夹下的, 名字就改为   1号_歌词.csv
示例中, 有  1号  和  2号  两个文件夹,
1号 中提取其下txt中的数字后, 生成的csv文件, 带上前缀  1号_
2号 中提取其下txt中的数字后, 生成的csv文件, 带上前缀  2号_

TOP

回复 22# 5i365
  1. #@&cls&powershell -version 2.0 "type '%~0'|out-string|iex"&pause&exit
  2. $r='^(\d+).+' #1
  3. #$r='\D+(\d+)\D+' #2
  4. #$r='\D+(\d+)$' #3
  5. $a=@{}
  6. $f=gc 歌单.csv -Encoding UTF8
  7. $f|%{
  8.     $z=$_ -replace '^(\d+).*','$1'
  9.     if (!($a.ContainsKey($z))){$a.$z=$_}
  10. }
  11. $b=@{}
  12. $d=@{}
  13. dir ".\任务" -recu * -inc *原唱*.txt,*伴奏*.txt,*歌词*.txt|%{
  14.     if($_ -match '(原唱|伴奏|歌词)'){$c=$Matches[0]}
  15.     foreach($i in gc $_){
  16.         if($i -match '\d'){
  17.             $z=$i -replace $r,'$1'
  18.             if(!($b.ContainsKey($z))){$b.$z=$a.$z;$d.$c+=@($a.$z)}
  19.         }
  20.     }
  21.     #if($b.ContainsKey($z)){sc $_ ''} #清空
  22.     #$z=-1 #清空
  23. }
  24. $d.keys|%{sc -Encoding UTF8 $($_+'.csv') ($f[0],($d.$_|sort{[int]($_ -split ',')[0]}))}
复制代码

TOP

本帖最后由 5i365 于 2022-1-21 19:07 编辑

回复 21# idwma


您好, 现在有两个问题想请教
1.有时获取的.txt文件中,例如下面的示例, 数字并不全是在开头, 而是在一行的中间[如下面的32]或结尾[如下面的28], 怎样设置三个筛选开关分别对应三种情况?  例如, 我只想筛选结尾的数字时就将其开关打开
--------------------------------------------------------------------
58有问题
80伴奏有问题 需要重新下载正确的
正确的32, 错误的28
132没有伴奏

2.txt文件, 可能在不同的文件夹中, 想在导出的csv文件名前,加上其所在的文件夹名
例如导出的   歌词.csv  文件, 他是筛选的 1号 文件夹下的, 名字就改为   1号_歌词.csv
--------------------------------------------------------------------------------------------------------------------------------------
要修改的代码, 及文件 https://send.cm/d/84IN
  1. #@&cls&powershell -version 2.0 "type '%~0'|out-string|iex"&pause&exit
  2. $a=@{}
  3. $f=gc 歌单.csv -Encoding UTF8
  4. $f|%{
  5.     $z=$_ -replace '^(\d+).*','$1'
  6.     if (!($a.ContainsKey($z))){$a.$z=$_}
  7. }
  8. $b=@{}
  9. $d=@{}
  10. dir ".\任务" -recu * -inc *原唱*.txt,*伴奏*.txt,*歌词*.txt|%{
  11.     if($_ -match '(原唱|伴奏|歌词)'){$c=$Matches[0]}
  12.     foreach($i in gc $_){
  13.         if($i -match '\d'){
  14.             $z=$i -replace '\D*(\d+)\D*','$1'
  15.             if(!($b.ContainsKey($z))){$b.$z=$a.$z;$d.$c+=@($a.$z)}
  16.         }
  17.     }
  18.     #if($b.ContainsKey($z)){sc $_ ''} #清空
  19.     #$z=-1 #清空
  20. }
  21. $d.keys|%{sc -Encoding UTF8 $($_+'.csv') ($f[0],($d.$_|sort{[int]($_ -split ',')[0]}))}
复制代码

TOP

回复 20# 5i365


    18
19

TOP

本帖最后由 5i365 于 2022-1-13 18:39 编辑

回复 19# idwma


    在我的那个压缩包里面的示例执行, 把版本删了可以执行, 但是我改了一下dir路径, 和过滤的文件名的文字, 执行就出错了, 多亏有备份, 因为有些txt文件会被清空

如果不清空原txt, 只导出独立的文本, 需要注释哪行代码?

TOP

回复 18# 5i365


    开win10试了一下自带的5.1也可以的

TOP

回复 17# idwma


    大侠, 刚刚在WIN10上运行直接提示 让装相对应的.net, 应该是 第一行的 限定版本导致的, 而win10上没有.net 2

我把版本号删了, 运行不成功, 也报错, 以前的那个批处理 就不用限定PS版本, 只是把所有的数字都输出到一个b.csv中了

TOP

回复 16# 5i365
  1. #@&cls&powershell -version 2.0 "type '%~0'|out-string|iex"&pause&exit
  2. $a=@{}
  3. $f=gc a.csv
  4. $f|%{
  5.     $z=$_ -replace '^(\d+).*','$1'
  6.     if (!($a.ContainsKey($z))){$a.$z=$_}
  7. }
  8. $b=@{}
  9. $d=@{}
  10. dir -recu * -inc *原唱*.txt,*伴奏*.txt,*歌词*.txt|%{
  11.     if($_ -match '(原唱|伴奏|歌词)'){$c=$Matches[0]}
  12.     foreach($i in gc $_){
  13.         if($i -match '\d'){
  14.             $z=$i -replace '\D*(\d+)\D*','$1'
  15.             if(!($b.ContainsKey($z))){$b.$z=$a.$z;$d.$c+=@($a.$z)}
  16.         }
  17.     }
  18.     if($b.ContainsKey($z)){sc $_ ''}
  19.     $z=-1
  20. }
  21. $d.keys|%{sc $($_+'.csv') ($f[0],($d.$_|sort{[int]($_ -split ',')[0]}))}
复制代码
1

评分人数

    • 5i365: 大侠写的PS和CMD太精炼了, 得细细品, 感谢!技术 + 1

TOP

回复 15# idwma

好的, 多谢, 另外目前代码中 下面这行代码, 是搜索所有的这些txt文件中的数字,对比a.csv的第一列的数字后,然后输出一个b.csv, 我现在想: 包含*原唱*.txt中的文件夹中的数字对比a.csv的第一列的数字后,输出为 原唱.csv, 包含*伴奏*.txt中的文件夹中的数字对比a.csv的第一列的数字后,输出为 伴奏.csv, 包含*歌词*.txt中的文件夹中的数字对比a.csv的第一列的数字后,输出为 歌词.csv
dir -recu * -inc *原唱*.txt,*伴奏*.txt,*歌词*.txt

    https://wss1.cn/f/7cfkwglj3kw 复制链接到浏览器打开

TOP

回复 14# 5i365


    文件链接过期了再发一个来看看

TOP

回复 13# idwma


    没有清空 那些文件, 生成的b.csv里只有标头

TOP

返回列表