Board logo

标题: [文本处理] 批处理如何将文本里的标点符号替换成回车换行符? [打印本页]

作者: 1879362421a    时间: 2016-10-1 10:45     标题: 批处理如何将文本里的标点符号替换成回车换行符?

本帖最后由 pcl_test 于 2016-10-1 12:26 编辑

求助,BAT替换文本内容为下一行
文本内容为:为进一步强化**监督,规范行政**行为。不断提高南安市的依法行政工作水平、经南安市人民**研究
替换问:
为进一步强化**监督
规范行政**行为
不断提高南安市的依法行政工作水平
经南安市人民**研究

特征为:所有的标点符号
备注:大约有7000个文本。
作者: CrLf    时间: 2016-10-1 15:19

本帖最后由 CrLf 于 2016-10-1 15:20 编辑
  1. @mshta http://bathome.net/s/hta/index.html "WSH.StdIn.ReadAll().replace(/[。、,;!?~—…《》【】“”‘’]+/g,'\r\n')" <"你的文件.txt" >"修改后.txt"
复制代码
注:
win7 下可简写为 mshta http://bathome.net/s/hta/ ....
其他环境下请写成 mshta http://bathome.net/s/hta/index.html ....
作者: DiamondbacK    时间: 2016-10-1 16:10

  1. PowerShell -c "(Get-Content \"inputFile\") -split '\p{P}+'"
复制代码
  1. >con gawk -v RS=[[:punct:]]+ 1 inputFile
复制代码





欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2