标题: [文本处理] [已解决]大文本,批处理如何实现指定列合并。 [打印本页]
作者: 每天几分 时间: 2023-3-31 17:54 标题: [已解决]大文本,批处理如何实现指定列合并。
如:
1.txt
因 yin 英 ying
……
实现:
2.txt
因英 yinying
……
原本是4列,合并后就是2列。
Excel 可以解决,但太慢了,我试着用gawk代码,好像不起作用,不知哪里的问题。
gawk -F '\t' '{print $1$3, $2$4}' 1.txt > 2.txt
作者: Batcher 时间: 2023-3-31 18:02
回复 1# 每天几分 - gawk -F "\t" "{print $1$3, $2$4}" 1.txt > 2.txt
复制代码
作者: 每天几分 时间: 2023-3-31 18:41
回复 2# Batcher
不对,变3列了,
要这样才对
作者: Five66 时间: 2023-3-31 19:29
请确保
无bom uft8编码
tab分割每列
斜杠n换行
作者: 77七 时间: 2023-3-31 20:39
- @echo off
- (for /f "tokens=1-4" %%a in (1.txt) do (
- echo %%a%%c %%b%%d
- ))>2.txt
- pause
复制代码
批处理也不是很慢,我试了一下,百万行,1分钟
作者: xp3000 时间: 2023-3-31 20:46
看你的文本是- 因\s\s\s\s\s\s\s\syin\s\s\s\s\s\s\s\s英\s\s\s\s\s\s\s\sying
复制代码
不是\t,所以要改一改- gawk -F "[ \t]+" "{print $1$3, $2$4}" 1.txt > 2.txt
复制代码
作者: Batcher 时间: 2023-3-31 21:48
回复 3# 每天几分
请把你的1.txt传上来,看看分隔符到底是空格还是制表符。
如果需要上传文件,可以用阿里云盘或百度网盘。
作者: 每天几分 时间: 2023-3-31 22:08
本帖最后由 每天几分 于 2023-3-31 22:18 编辑
回复 7# Batcher
就是制表符啊,复制到论坛就变很多个空格了。可以了,utf8编码的问题。
作者: Batcher 时间: 2023-3-31 22:18
回复 8# 每天几分
请把你的1.txt传上来,看看分隔符到底是空格还是制表符。
如果需要上传文件,可以用阿里云盘或百度网盘。
欢迎光临 批处理之家 (http://bbs.bathome.net/) |
Powered by Discuz! 7.2 |