[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[问题求助] [已解决]请问用sed怎么处理下面这段1.txt文本文件内容,或者其他什么比sed更简单的方法

本帖最后由 jzp820927 于 2013-10-23 20:05 编辑

请教个问题,就是怎么把1.txt这个文本文件里面的如下内容

  1、中国(党党员)是______中的有主义觉悟的先锋战士。(B)A、农民阶级   B、中国工人阶级    C、知识分子
  2、“党员”重(ABC)要思想,是我们党的______。(C)A、立国之本、执政之基、力量之源    B、立党之本、强国之基、力量之源  C、立党之本、执政之基、力量之源
  3、中国党以_______作为(123)自己的行为指南。(c)A、马克思列宁主义、思想B、建设有中国特色社会主义理论C、马克思列宁主义、思想、理论和”党员”重要思想

处理成如下这个结果,里面的每个题里面的()中的字母提取出来,放在题目最后(用括号括起来,括号前面用逗号分割),而且把之前的括号里面的字母去掉,结果像下面这样:
(注意:题名里面有可能还有其他括号有内容的,我只要提取每个题目里面括号里面只包含1个字母(有可能是大写或者小写),也就是提取答案选项放到最后,用逗号分割,再把题目前面的答案去掉,只保留空括号)

  1、中国(党党员)是______中的有主义觉悟的先锋战士。()A、农民阶级   B、中国工人阶级    C、知识分子,(B)
  2、“党员”重(ABC)要思想,是我们党的______。()A、立国之本、执政之基、力量之源    B、立党之本、强国之基、力量之源  C、立党之本、执政之基、力量之源,(C)
  3、中国党以_______作为(123)自己的行为指南。()A、马克思列宁主义、思想B、建设有中国特色社会主义理论C、马克思列宁主义、思想、理论和”党员”重要思想,(c)
1

评分人数

    • Batcher: 感谢给帖子标题标注[已解决]字样PB + 2

  1. sed -r "s/(([A-Za-z]))(.*)/()\2(\1)/" a.txt > b.txt
复制代码
1

评分人数

TOP

非常感谢,问题搞定,对正则学习不够深入,以后还得慢慢学习。

TOP

回复 3# jzp820927


    请点击2楼右下角的“评分”按钮
我帮忙写的代码不需要付钱。如果一定要给,请在微信群或QQ群发给大家吧。
【微信公众号、微信群、QQ群】http://bbs.bathome.net/thread-3473-1-1.html
【支持批处理之家,加入VIP会员!】http://bbs.bathome.net/thread-67716-1-1.html

TOP

已经评分,非常感谢

TOP

回复 2# DAIC


   能否解释一下??
sed 替换语法不是"/s/str1/str2/g"吗?这句里面没有/g?
(([A-Za-z]))(.*)是不是表示以字母开头,紧接(,后接任意内容,然后以)结尾
()\2(\1) , \1,\2转义成为了什么?这句话代表什么?

TOP

回复 5# jzp820927


       能否解释一下??
sed 替换语法不是"/s/str1/str2/g"吗?这句里面没有/g?
(([A-Za-z]))(.*)是不是表示以字母开头,紧接(,后接任意内容,然后以)结尾
()\2(\1) , \1,\2转义成为了什么?这句话代表什么?

TOP

回复 6# ImpCosBoss


g 是可以有也可以没有的,具体情况具体分析。
http://www.gnu.org/software/sed/ ... _0022s_0022-Command

g
    Apply the replacement to all matches to the regexp, not just the first.

number
    Only replace the numberth match of the regexp.

    Note: the posix standard does not specify what should happen when you mix the g and number modifiers, and currently there is no widely agreed upon meaning across sed implementations. For GNU sed, the interaction is defined to be: ignore matches before the numberth, and then match and replace all matches from the numberth on.

TOP

()\2(\1) , \1,\2转义成为了什么?这句话代表什么?

Google搜索正则表达式 后向引用

TOP

返回列表