标题: [文本处理] 求批处理提取文本内容的方式,可能要正则 [打印本页]
作者: hdjdfb 时间: 2021-7-28 01:44 标题: 求批处理提取文本内容的方式,可能要正则
比如
静夜思作者:李白床前明月光疑是地上霜举头望明月低头思故乡
需要提取单字段是
作者:李白
作者后面可能是三个字比如白居易
有没有办法
是在一个TXT里面有大量的这种诗句,要提取作者
作者: went 时间: 2021-7-28 02:04
如果要智能提取作者的话,要分情况,全是五言绝句还是有其它的?
作者: xhjddjb 时间: 2021-7-28 07:50
回复 2# went
全是五言绝句,位置比较固定
作者: qixiaobin0715 时间: 2021-7-28 08:44
如果行尾不存在空白字符。- @echo off
- setlocal enabledelayedexpansion
- for /f "delims=" %%a in ('findstr /r "作者" a.txt') do (
- set str=%%a
- set str=!str:*作者=作者!
- set str=!str:~0,-20!
- echo,!str!
- )
- pause
复制代码
作者: zztxbat 时间: 2021-7-28 08:57
回复 4# qixiaobin0715
这个 ~0,-20啥意思
作者: qixiaobin0715 时间: 2021-7-28 09:07
回复 5# zztxbat
http://bbs.bathome.net/thread-14927-1-1.html
作者: Batcher 时间: 2021-7-28 09:27
回复 5# zztxbat
参考set命令教程第8页
http://bbs.bathome.net/thread-31727-1-1.html
作者: qixiaobin0715 时间: 2021-7-28 09:59
回复 5# zztxbat
你真厉害,上来一次注册一次。
作者: zztxbat 时间: 2021-7-28 10:31
回复 4# qixiaobin0715
试了下发现不行
作者: Batcher 时间: 2021-7-28 10:51
回复 9# zztxbat
请参考Q-01观察一下哪行代码在报错以及详细的报错信息:
https://mp.weixin.qq.com/s/6lbb97qUOs1sTyKJfN0ZEQ
如果仍然看不到报错信息,请把你测试用的文件和bat脚本打包上传到网盘以便他人帮忙排查。
作者: autoav 时间: 2021-7-29 13:53
本帖最后由 autoav 于 2021-7-29 13:55 编辑
一个txt里,我觉得用emeditor这种软件更方便,利用正则表达式,实时查看每一步操作,且可以撤销。
批处理的优点还是大量文件的简单处理
作者: qixiaobin0715 时间: 2021-7-29 13:57
回复 11# autoav
多个文件也可,写个宏文件即可。
作者: autoav 时间: 2021-7-29 15:52
回复 autoav
多个文件也可,写个宏文件即可。
qixiaobin0715 发表于 2021-7-29 13:57
是的,批处理不直观,不可撤销,只适合大量文件的简单处理
作者: qixiaobin0715 时间: 2021-7-29 21:32
回复 13# autoav
可是一般来说批处理处理文本时,是在副本上进行的,即使有问题也不会对源文件造成影响,不存在恢复问题,除非有意进行控制。
作者: autoav 时间: 2021-8-2 11:04
回复 autoav
可是一般来说批处理处理文本时,是在副本上进行的,即使有问题也不会对源文件造成影响,不存 ...
qixiaobin0715 发表于 2021-7-29 21:32
我用批处理,经常是大量文件,基本上都是反复确认,一旦执行后,不会留底,当然也都是小说,真的错了,也不会引起大问题。
作者: cmd1152 时间: 2021-8-2 22:56
回复 15# autoav
我是直接放隔离沙箱,怕出问题
欢迎光临 批处理之家 (http://bbs.bathome.net/) |
Powered by Discuz! 7.2 |