Board logo

标题: [文本处理] [已解决]大文本,批处理如何实现指定列合并。 [打印本页]

作者: 每天几分    时间: 2023-3-31 17:54     标题: [已解决]大文本,批处理如何实现指定列合并。

如:
1.txt
因        yin        英        ying
……


实现:
2.txt
因英        yinying
……



原本是4列,合并后就是2列。
Excel 可以解决,但太慢了,我试着用gawk代码,好像不起作用,不知哪里的问题。
gawk -F '\t' '{print $1$3, $2$4}' 1.txt > 2.txt
作者: Batcher    时间: 2023-3-31 18:02

回复 1# 每天几分
  1. gawk -F "\t" "{print $1$3, $2$4}" 1.txt > 2.txt
复制代码

作者: 每天几分    时间: 2023-3-31 18:41

回复 2# Batcher

不对,变3列了,
   

要这样才对
作者: Five66    时间: 2023-3-31 19:29

请确保
无bom uft8编码
tab分割每列
斜杠n换行
作者: 77七    时间: 2023-3-31 20:39

  1. @echo off
  2. (for /f "tokens=1-4" %%a in (1.txt) do (
  3. echo %%a%%c        %%b%%d
  4. ))>2.txt
  5. pause
复制代码

批处理也不是很慢,我试了一下,百万行,1分钟
作者: xp3000    时间: 2023-3-31 20:46

看你的文本是
  1. 因\s\s\s\s\s\s\s\syin\s\s\s\s\s\s\s\s英\s\s\s\s\s\s\s\sying
复制代码
不是\t,所以要改一改
  1. gawk -F "[ \t]+" "{print $1$3, $2$4}" 1.txt > 2.txt
复制代码

作者: Batcher    时间: 2023-3-31 21:48

回复 3# 每天几分


请把你的1.txt传上来,看看分隔符到底是空格还是制表符。
如果需要上传文件,可以用阿里云盘或百度网盘。
作者: 每天几分    时间: 2023-3-31 22:08

本帖最后由 每天几分 于 2023-3-31 22:18 编辑

回复 7# Batcher


    就是制表符啊,复制到论坛就变很多个空格了。可以了,utf8编码的问题。
作者: Batcher    时间: 2023-3-31 22:18

回复 8# 每天几分


请把你的1.txt传上来,看看分隔符到底是空格还是制表符。
如果需要上传文件,可以用阿里云盘或百度网盘。




欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2