批处理之家 - Powered by Discuz! Board

标题: [文本处理] [已经解决]bat 提取txt内符合拼音结构的行 [打印本页]

作者: w1983912 时间: 2015-3-31 20:30 标题: [已经解决]bat 提取txt内符合拼音结构的行

本帖最后由 w1983912 于 2015-4-2 11:09 编辑

TXT  一条一行  提取第一个标点符号前符合拼音结构的行  和网址那个域名有点类似

akms120;miyw
aaanyeti,m1e
miayean,ui
zhange123,e
zhanghaip,o9p

只有以下两个符合
aaanyeti,m1e
miayean,ui

拼音字典 pinyin.txt  一个一行
a
e
u
ai
an
ye
ti
mi
hao
heng
zhang
zhuang
等等省略了很多  匹配起来可能要先匹配最大的那个再匹配后面的

如  zhanghaoduo    会先匹配 zhang  而不会先匹配 zhan 或zha

请各位大神帮帮忙先谢谢了

作者: pcl_test 时间: 2015-3-31 20:50

本帖最后由 pcl_test 于 2015-4-1 15:53 编辑

回复 1# w1983912

@echo off
setlocal enabledelayedexpansion
(for /f "tokens=1* delims=,;" %%a in ('type "测试.txt"') do (
set "word=%%aж"
for /f "delims=" %%b in ('type "pinyin.txt" ^|sort /+65535') do (
set "word=!word:%%b=!"
)
if "!word!" == "ж" findstr /b /r "%%a" "测试.txt"
))>"结果.txt"
pause
复制代码

作者: w1983912 时间: 2015-4-2 11:09

回复 2# pcl_test

技术不是一般般谢谢

欢迎光临批处理之家 (http://bbs.bathome.net/)