找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 24899|回复: 4

[文本处理] 批处理如何提取特定数字和汉字?跪求大神

[复制链接]
发表于 2017-9-6 01:34:33 | 显示全部楼层 |阅读模式
825
10000001
止血药

false
t
10000002
粗制小黄丹

2
药品
ICON_I_Hp_02

10000003
精制小黄丹

以上,这是某个文本的内容,我要提取里面的8位数字这一行,和这8位数字下面一行,并在数字后面添加 ; 号。
要求的结果如下

10000001;止血药
10000002;粗制小黄丹
10000003;精制小黄丹

这是原始样本

这是结果文件

谢谢各位大神。。
发表于 2017-9-6 06:27:23 | 显示全部楼层
最好能放一两个原始样品上来,如太大,可提供部分。
发表于 2017-9-6 06:59:15 | 显示全部楼层
本帖最后由 codegay 于 2017-9-6 07:15 编辑

python的regex 正则增强模块支持用\p{han} 匹配汉字,非常直观。

提取的正则大约是这样写 \d{8}\n\p{han}+
发表于 2017-9-6 08:37:07 | 显示全部楼层
[^x00-xff] 匹配汉字
发表于 2017-9-7 08:45:56 | 显示全部楼层
还以为是什么正经的东西。原来是私服游戏的配置文件。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-19 22:16 , Processed in 0.017388 second(s), 8 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表