Board logo

标题: [问题求助] [已解决]请问用sed怎么处理下面这段1.txt文本文件内容,或者其他什么比sed更简单的方法 [打印本页]

作者: jzp820927    时间: 2013-10-18 10:56     标题: [已解决]请问用sed怎么处理下面这段1.txt文本文件内容,或者其他什么比sed更简单的方法

本帖最后由 jzp820927 于 2013-10-23 20:05 编辑

请教个问题,就是怎么把1.txt这个文本文件里面的如下内容

  1、中国(党党员)是______中的有主义觉悟的先锋战士。(B)A、农民阶级   B、中国工人阶级    C、知识分子
  2、“党员”重(ABC)要思想,是我们党的______。(C)A、立国之本、执政之基、力量之源    B、立党之本、强国之基、力量之源  C、立党之本、执政之基、力量之源
  3、中国党以_______作为(123)自己的行为指南。(c)A、马克思列宁主义、思想B、建设有中国特色社会主义理论C、马克思列宁主义、思想、理论和”党员”重要思想

处理成如下这个结果,里面的每个题里面的()中的字母提取出来,放在题目最后(用括号括起来,括号前面用逗号分割),而且把之前的括号里面的字母去掉,结果像下面这样:
(注意:题名里面有可能还有其他括号有内容的,我只要提取每个题目里面括号里面只包含1个字母(有可能是大写或者小写),也就是提取答案选项放到最后,用逗号分割,再把题目前面的答案去掉,只保留空括号)

  1、中国(党党员)是______中的有主义觉悟的先锋战士。()A、农民阶级   B、中国工人阶级    C、知识分子,(B)
  2、“党员”重(ABC)要思想,是我们党的______。()A、立国之本、执政之基、力量之源    B、立党之本、强国之基、力量之源  C、立党之本、执政之基、力量之源,(C)
  3、中国党以_______作为(123)自己的行为指南。()A、马克思列宁主义、思想B、建设有中国特色社会主义理论C、马克思列宁主义、思想、理论和”党员”重要思想,(c)
作者: DAIC    时间: 2013-10-18 11:07

  1. sed -r "s/(([A-Za-z]))(.*)/()\2(\1)/" a.txt > b.txt
复制代码

作者: jzp820927    时间: 2013-10-18 11:26

非常感谢,问题搞定,对正则学习不够深入,以后还得慢慢学习。
作者: Batcher    时间: 2013-10-18 12:36

回复 3# jzp820927


    请点击2楼右下角的“评分”按钮
作者: jzp820927    时间: 2013-10-18 12:55

已经评分,非常感谢
作者: ImpCosBoss    时间: 2013-11-5 15:20

回复 2# DAIC


   能否解释一下??
sed 替换语法不是"/s/str1/str2/g"吗?这句里面没有/g?
(([A-Za-z]))(.*)是不是表示以字母开头,紧接(,后接任意内容,然后以)结尾
()\2(\1) , \1,\2转义成为了什么?这句话代表什么?
作者: ImpCosBoss    时间: 2013-11-5 15:22

回复 5# jzp820927


       能否解释一下??
sed 替换语法不是"/s/str1/str2/g"吗?这句里面没有/g?
(([A-Za-z]))(.*)是不是表示以字母开头,紧接(,后接任意内容,然后以)结尾
()\2(\1) , \1,\2转义成为了什么?这句话代表什么?
作者: DAIC    时间: 2013-11-5 15:31

回复 6# ImpCosBoss


g 是可以有也可以没有的,具体情况具体分析。
http://www.gnu.org/software/sed/ ... _0022s_0022-Command

g
    Apply the replacement to all matches to the regexp, not just the first.

number
    Only replace the numberth match of the regexp.

    Note: the posix standard does not specify what should happen when you mix the g and number modifiers, and currently there is no widely agreed upon meaning across sed implementations. For GNU sed, the interaction is defined to be: ignore matches before the numberth, and then match and replace all matches from the numberth on.
作者: DAIC    时间: 2013-11-5 15:34

()\2(\1) , \1,\2转义成为了什么?这句话代表什么?

Google搜索正则表达式 后向引用




欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2