批处理之家 - Powered by Discuz! Board

标题: [文本处理] 批处理怎样把文本的每一个字符转成单独行？ [打印本页]

作者: 398832385 时间: 2023-2-26 16:35 标题: 批处理怎样把文本的每一个字符转成单独行？

求大神帮忙，

把文本的每一个字符转成单独行

例，字符.txt

啊呵埃挨哎唉哀皑癌蔼矮艾碍爱隘
鞍氨安俺按暗岸胺案肮昂盎凹敖熬
翱袄傲奥懊澳芭捌扒叭吧笆八疤巴
拔靶把耙坝霸罢爸白柏百摆佰败拜
稗斑班搬扳般颁板版扮拌伴瓣半办
绊邦帮梆榜膀绑棒磅蚌镑傍谤苞胞
包褒剥薄雹保堡饱宝抱报暴豹鲍爆
杯碑悲卑北辈背贝钡倍狈备惫焙被

转换成

啊
呵
埃
挨
哎
唉
哀
皑
癌
蔼
矮
艾
碍
爱
隘
鞍
……

每个文字都单独占一行

作者: 77七 时间: 2023-2-26 16:57

@echo off
rem 根据实际情况调整100数值
for /f "delims=" %%i in ('type "字符.txt"') do (
	set "str=%%i"
	setlocal enabledelayedexpansion
	for /l %%l in (0,1,100) do (
		if not "!str:~%%l,1!" equ "" (
			>>字符2.txt echo,!str:~%%l,1!
		)
	)
	endlocal
)
pause
复制代码

这样行吗

作者: 398832385 时间: 2023-2-26 17:05

回复 2# 77七

生成的是

瀛楃2.txt

文件内的内容：
%
i

作者: 77七 时间: 2023-2-26 17:08

回复 3# 398832385

把批处理和文本都保存为ansi编码格式试试

作者: hfxiang 时间: 2023-2-26 17:56

本帖最后由 hfxiang 于 2023-2-26 19:51 编辑

回复 1# 398832385

将

啊呵埃挨哎唉哀皑癌蔼矮艾碍爱隘
鞍氨安俺按暗岸胺案肮昂盎凹敖熬
翱袄傲奥懊澳芭捌扒叭吧笆八疤巴
拔靶把耙坝霸罢爸白柏百摆佰败拜
稗斑班搬扳般颁板版扮拌伴瓣半办
绊邦帮梆榜膀绑棒磅蚌镑傍谤苞胞
包褒剥薄雹保堡饱宝抱报暴豹鲍爆
杯碑悲卑北辈背贝钡倍狈备惫焙被
复制代码

以ANSI编码板式保存为1.txt
下载gawk（ http://bcn.bathome.net/tool/4.1.3/gawk.exe ），执行：

gawk -vFS="" "{for(i=0;i++<NF;)print$i}" 1.txt>2.txt
复制代码

2.txt就是你想要的结果

作者: 398832385 时间: 2023-2-26 18:53

本帖最后由 398832385 于 2023-2-26 19:03 编辑

回复 4# 77七

少了一些字~总共6,688个字，转出来有6270个字

作者: 398832385 时间: 2023-2-26 19:00

回复 5# hfxiang

少了很多字~总共6,688个字，但是转出来只有5852个字
比如第一眼就看到少了最后一个字

作者: 77七 时间: 2023-2-26 19:23

回复 6# 398832385

请提供一个执行后少字的样本，要不然我也不知道错在哪里

作者: hfxiang 时间: 2023-2-26 19:54

回复 7# 398832385

抱歉，把“i++”写成“++i”了，造成每行最后1个字给忽略了，已修正

gawk -vFS="" "{for(i=0;i++<NF;)print$i}" 1.txt>2.txt
复制代码

作者: qixiaobin0715 时间: 2023-2-27 08:28

http://bbs.bathome.net/viewthrea ... B%D7%D6%D2%BB%D0%D0

作者: 398832385 时间: 2023-2-27 11:26

回复 9# hfxiang

为啥转出来是6270个字，但是我的原版里面是6688个字

作者: Batcher 时间: 2023-2-27 14:30

回复 11# 398832385

请把原始文件上传到网盘，我试试。

作者: 398832385 时间: 2023-2-28 10:27

回复 12# Batcher

链接：https://pan.baidu.com/s/1uLg_nxSNn3EzJlRgWosCGw?pwd=g43n
提取码：g43n

作者: hfxiang 时间: 2023-2-28 11:42

回复 13# 398832385

15（字/行）X（418行）=6270（字），哪来 6688 字？

作者: 帝尊 时间: 2023-2-28 13:12

@echo off
setlocal enabledelayedexpansion

set "filename=字符.txt"
set "outputfile=output.txt"

if exist "%outputfile%" del "%outputfile%"

for /f "usebackq delims=" %%a in ("%filename%") do (
  set "line=%%a"
  for /l %%i in (0,1,!strlen!) do (
    set "char=!line:~%%i,1!"
    echo !char!>>"%outputfile%"
  )
)

echo "转换完成"

exit /b

:: 函数：获取字符串长度
:setlen
setlocal
set "s=!%~1!"
set "len=0"
for /l %%i in (0,1,32767) do if not "!s:~%%i,1!"=="" set /a "len=%%i+1"
endlocal & set "%~2=%len%"
exit /b
复制代码

首先，定义了输入文件名为字符.txt和输出文件名为output.txt。接着，使用for循环逐行读取输入文件，对于每一行，获取其长度并逐个字符处理。内部使用了一个自定义函数setlen来获取字符串长度。在内部的循环中，使用字符串切片来逐个获取字符，并将每个字符写入输出文件output.txt的一行。最后输出"转换完成"，并退出脚本。

注意：如果输入文件包含 UTF-8 编码的中文字符，需要将脚本文件保存为 UTF-8 编码，并在脚本文件开头添加chcp 65001以设置命令行窗口的字符编码。

作者: 398832385 时间: 2023-2-28 14:40

回复 14# hfxiang

啊~我怎么看的是16行？

作者: newswan 时间: 2023-3-4 09:27

本帖最后由 newswan 于 2023-3-4 12:34 编辑

( Get-Content 国标.txt ) -replace "(?<=[^`n])(?=[^`n])","`n" | Out-File new.txt
复制代码

欢迎光临批处理之家 (http://bbs.bathome.net/)