标题: [文件操作] 【已解决】小白求教bat如何处理字符段长度 [打印本页]
作者: lanmao0712 时间: 2021-1-30 12:31 标题: 【已解决】小白求教bat如何处理字符段长度
本帖最后由 lanmao0712 于 2021-1-31 13:54 编辑
如图,现有上千个类似文件需要处理,去除每行字符长度超过10的,用什么命令可以去除,大佬们赐教
作者: flashercs 时间: 2021-1-30 19:02
- @echo off
- @REM 处理当前目录的文件,删除大于10个字符的行,将处理结果放到output目录。
- cd /d "%~dp0"
- set outdir=.\output
- for /f "delims=" %%A in ('dir /a-d /b *.txt') do (
- >"%outdir%\%%~nxA" findstr /rbv "............*"
- )
- pause
- exit /b
复制代码
作者: netdzb 时间: 2021-1-30 20:31
回复 2# flashercs
这个用sed第三方工具怎么处理啊?
作者: Batcher 时间: 2021-1-30 20:42
回复 3# netdzb - sed -r -i "/.{11}/d" *.txt
复制代码
作者: netdzb 时间: 2021-1-30 21:16
回复 4# Batcher
sed -r -i "/.{11}/d" *.txt
上面的正则{11}表示什么意思?为什么editplus
^.{10,}$ ===> 空
\n ===> 空
需要2次才能完成任务。
我刚才试验了这个命令
sed -r -i "/.{11,}/d" *.txt和你的命令操作是否一样?
再次请教,谢谢!
作者: Batcher 时间: 2021-1-30 21:23
回复 5# netdzb
http://www.gnu.org/software/sed/manual/sed.html#BRE-syntax
\{i\}
As *, but matches exactly i sequences (i is a decimal integer; for portability, keep it between 0 and 255 inclusive).
\{i,j\}
Matches between i and j, inclusive, sequences.
\{i,\}
Matches more than or equal to i sequences.
作者: netdzb 时间: 2021-1-30 21:46
回复 4# Batcher
sed命令,我还有个问题,就是不用sed命令自带的d来删除行。
改成匹配除了(回车\n)的任意10个以上的字符,以回车结束的字符串,替换为空,这样的sed命令怎么写?
作者: lanmao0712 时间: 2021-1-31 01:16
本帖最后由 lanmao0712 于 2021-1-31 01:23 编辑
回复 2# flashercs
运行后一直没反应,for /f "delims=" %%A in ('dir /a-d /b *.txt') do (>"%outdir%\%%~nxA" findstr /rbv "............*"这个最后的*是做什么的?
还有些文件里面内容的-是英文符号.这个会不会有影响呢
作者: flashercs 时间: 2021-1-31 07:18
回复 8# lanmao0712
这么大文件 那用4楼代码,论坛下载sed.exe,4楼代码是直接替换原文件。
作者: netdzb 时间: 2021-1-31 09:38
本帖最后由 netdzb 于 2021-1-31 09:47 编辑
回复 9# flashercs
是不是这样写就可以了?
\[^\n]{10,}\n ===> 空
换成命令是这样的
sed -r -i "/[^\n]{10,}\n//" *.txt
作者: qixiaobin0715 时间: 2021-1-31 09:56
- @echo off
- md newfiles
- setlocal enabledelayedexpansion
- for %%a in (*.txt) do (
- (for /f "usebackq delims=" %%b in ("%%a") do (
- set "str=%%b"
- if "!str:~10!"=="" echo,%%b
- ))>newfiles\%%a
- )
- pause
复制代码
作者: Batcher 时间: 2021-1-31 09:59
回复 10# netdzb
不是。你亲自一试便知。
作者: qixiaobin0715 时间: 2021-1-31 10:02
回复 5# netdzb
editplus一次替换
^.{10,}\n
作者: netdzb 时间: 2021-1-31 10:20
回复 12# Batcher
我的意思是想匹配10个以上非回车换行的任意字符加上末尾的回车,替换为空。
改成这样就可以了吗?
sed -r -i "/[^\n]{10,}$\n//" *.txt
作者: Batcher 时间: 2021-1-31 10:32
回复 14# netdzb
你自己测试的时候成功了吗?
作者: netdzb 时间: 2021-1-31 10:33
回复 15# Batcher
有没有在线测试的平台,我是手机无法测试。
作者: netdzb 时间: 2021-1-31 11:12
回复 13# qixiaobin0715
0000102v02v02v02vsf-poe
0000469-poe
0000c2-poe
0000vO2vO2vO2vO2vO2vwv-poe
00022vip-poe
0003vwv-poe
0005vO2vO2vO2vwv-poe
0006vwv-poe
0007vwv-poe
0008vwv-poe
00099bet-poe
OOOlecai-poe
0024vipl0-poe
abcde
测试了editplus运行结果不对,是上面的结果。
作者: netdzb 时间: 2021-1-31 11:24
本帖最后由 netdzb 于 2021-1-31 11:29 编辑
回复 15# Batcher
刚才测试了,命令直接报错。
我的代码是不是应该写成下面这种形式,但表达式里面有正则总也写不对啊。
sed -i s/wav/flac/g "%%x"
作者: qixiaobin0715 时间: 2021-1-31 11:33
回复 17# netdzb
用EE测试结果如下:
作者: netdzb 时间: 2021-1-31 11:41
本帖最后由 netdzb 于 2021-1-31 11:42 编辑
回复 19# qixiaobin0715
你的EE是老版本吗?我用过试用期过了。
作者: Batcher 时间: 2021-1-31 14:00
回复 18# netdzb
不是。sed命令处理文本的方式跟你想象中的方式不一样。跨行处理一般是类似这样的操作:
http://bbs.bathome.net/thread-57708-1-1.html#pid235591
欢迎光临 批处理之家 (http://bbs.bathome.net/) |
Powered by Discuz! 7.2 |