[文本处理] [已解决]批处理怎样间断提取文本中的汉字？

文本内容：
中华12345人民afdvf共avfdvavfddv和vdfaszvfd国万岁
世asdvc43界h5e6gh人eh5r3民h66r5大团结mr56md万岁
……………………………………………………………………
……………………………………………………………………

类似这样的行有很多，规律就是汉字之间夹杂数字与字母，夹杂的数字与字母位数都随机。
怎么提取这些汉字，得到“中华人民共和国万岁”。

说明：
我会用逐位判断的方式提取，但是这个方法太麻烦，如何使用更简单的方法获取呢？

期待朋友们的帮助！

1 评分人数

Batcher: 感谢给帖子标题标注[已解决]字样PB + 2

escortmnm

列兵

Rank: 1

帖子: 8
积分: 16
技术: 0
捐助: 0
注册时间: 2010-8-16

2楼

发表于 2011-4-20 12:30 | 显示全部帖子

首先感谢楼上两位bat人的热心帮助。
sed命令确实是个办法，但是xp下面都没有，所以应用性不好。
batman 给的连接中使用了逐位判断外的另一种方式，就是将不满意的替换掉，确实是个好办法，再次感谢。
我考虑到用for/F解析怎么样，代码示例：

@echo off
setlocal enabledelayedexpansion
for /f "delims=" %%i in (abc.txt) do (
set n=%%i
for /f "tokens=1-20,* delims=0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz" %%a in ("!n!") do (
echo %%a%%b%%c%%d%%e%%f%%g%%h%%i!e!>>new_abc.txt)
)
pause
复制代码

但是这个方法对付分割数目少的可以，对付多的就实现不了了，请问怎么判断for里面到底需要多少个参数？

TOP

escortmnm

列兵

Rank: 1

帖子: 8
积分: 16
技术: 0
捐助: 0
注册时间: 2010-8-16

3楼

发表于 2011-4-20 13:54 | 显示全部帖子

膜拜！
我怎么就没想到呢，还是高手厉害。感谢你！
学习了。

TOP

返回列表

[新手上路]批处理新手入门导读	[视频教程]批处理基础视频教程	[视频教程]VBS基础视频教程	[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动	[批处理精品]CMD命令50条不能说的秘密	[在线下载]第三方命令行工具	[在线帮助]VBScript / JScript 在线参考

[文本处理] [已解决]批处理怎样间断提取文本中的汉字？

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]