- 帖子
- 12
- 积分
- 28
- 技术
- 0
- 捐助
- 0
- 注册时间
- 2023-9-28
|
[文本处理] 请教批处理txt文本行内容过长时按指定字节长度换行的问题
手头有大概300多万份TXT文件,UTF-8编码,内容包含中文、英文、日文、韩文、西里尔文等等几种种语言
需要将其中某些内容太长的行内容换行处理(多数行字符都是单字节和多字节字符混合共存)
前段时间写了按字符数换行的脚本,但因多数行内容为单字节字符和多字节字符共存,换行处理后,行内容长长短短,非常不统一
故而向大家请教让内容过长的行按字节长度换行的批量处理解决办法,可以是批处理代码,可以是软件,还可以是解决方案。。
先拜谢。。。
比如:文本“曹善.txt”
换行前内容:
曹善(Ts'ao Shan, style name Shih-liang, sobriquet Shu-san-sheng, 活動於西元十四世紀後期),江蘇華亭人,字世良,號樗散生,有詩名,處世剛正,不合於時。明太祖時,宋濂薦於朝,累徵不起,苦志臨池,初學鍾繇,行草學二王,與兄世長、兄子恭,具有書名,一時稱為東吳三曹。
换行后内容:
曹善(Ts'ao Shan, style name Shih-liang, sobriquet Shu-san-sheng, 活動於西元十四世紀後期),江蘇華亭
人,字世良,號樗散生,有詩名,處世剛正,不合於時。明太祖時,宋濂薦於朝,累徵不起,苦志臨池,初學鍾
繇,行草學二王,與兄世長、兄子恭,具有書名,一時稱為東吳三曹。 |
|