Board logo

标题: [问题求助] [已解决]再请教2个sed处理文本的问题 [打印本页]

作者: jzp820927    时间: 2013-10-18 13:13     标题: [已解决]再请教2个sed处理文本的问题

本帖最后由 jzp820927 于 2013-10-23 20:04 编辑

下面这段是需要处理的文本:
1、中国**党党员是______中的有**主义觉悟的先锋战士。(),A、农民阶级,B、中国工人阶级,C、知识分子
2、党的基层组织是党在社会基层组织中的____,是党的全部工作的战斗力的基础。(),A、核心堡垒,B、坚强核心,C、战斗堡垒,D、全部都是
3对利用职务上的便利,占用公物进行营利活动,情节严重的,给予____处分。(),A、撤销党内职务,B、留党察看,C、开除党籍

问题一:
在上面的题目中,有些题目有A,B,C,3个答案,有些题目有A,B,C,D,4个答案,现在我想对每道题目进行判断,如果有A,B,C,D,4个答案的不做处理,如果只有A,B,C,3个答案的,则在行末加1个逗号","。
如果只有A,B,2个答案的,要在行末加2个逗号",,",又怎么处理呢?

问题二:
有些题的题目序号后面有顿号,有些又没有,比如1和2都有,3就少了个顿号,如何判断每道题目的序号后有无顿号,如果有就不做处理,如果没有就在序号后面添加个顿号,保持排版的一致。
作者: DAIC    时间: 2013-10-18 13:33

解决问题一
  1. sed -r "s/[Cc]、[^Dd]+$/&,/; s/[Bb]、[^CcDd]+$/&,,/; " a.txt > b.txt
复制代码

作者: DAIC    时间: 2013-10-18 13:38

解决问题二
  1. sed -r "s/^([0-9]+)([^、])/\1、\2/"  a.txt > b.txt
复制代码

作者: jzp820927    时间: 2013-10-18 14:36

问题2的方法还存在问题,因为题目有上百道,序号就有2位数,3位数的,2位数以上的自己带有顿号的就出问题了,比如22、处理后就变成2、2、了,这个是怎么回事呢?
作者: DAIC    时间: 2013-10-18 15:04

回复 4# jzp820927


    直接回复我的帖子就行了,不用PM我。
作者: DAIC    时间: 2013-10-18 15:07

回复 4# jzp820927


试试这个:
  1. sed -r "s/^([0-9]+)([^、0-9])/\1、\2/"  a.txt > b.txt
复制代码

作者: jzp820927    时间: 2013-10-18 15:43

这个没问题了,终于搞定了,今天评不了分了,明天再评分。




欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2