[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[问题求助] [已解决]再请教2个sed处理文本的问题

本帖最后由 jzp820927 于 2013-10-23 20:04 编辑

下面这段是需要处理的文本:
1、中国**党党员是______中的有**主义觉悟的先锋战士。(),A、农民阶级,B、中国工人阶级,C、知识分子
2、党的基层组织是党在社会基层组织中的____,是党的全部工作的战斗力的基础。(),A、核心堡垒,B、坚强核心,C、战斗堡垒,D、全部都是
3对利用职务上的便利,占用公物进行营利活动,情节严重的,给予____处分。(),A、撤销党内职务,B、留党察看,C、开除党籍

问题一:
在上面的题目中,有些题目有A,B,C,3个答案,有些题目有A,B,C,D,4个答案,现在我想对每道题目进行判断,如果有A,B,C,D,4个答案的不做处理,如果只有A,B,C,3个答案的,则在行末加1个逗号","。
如果只有A,B,2个答案的,要在行末加2个逗号",,",又怎么处理呢?

问题二:
有些题的题目序号后面有顿号,有些又没有,比如1和2都有,3就少了个顿号,如何判断每道题目的序号后有无顿号,如果有就不做处理,如果没有就在序号后面添加个顿号,保持排版的一致。
1

评分人数

    • Batcher: 感谢给帖子标题标注[已解决]字样PB + 2

解决问题一
  1. sed -r "s/[Cc]、[^Dd]+$/&,/; s/[Bb]、[^CcDd]+$/&,,/; " a.txt > b.txt
复制代码

TOP

解决问题二
  1. sed -r "s/^([0-9]+)([^、])/\1、\2/"  a.txt > b.txt
复制代码

TOP

问题2的方法还存在问题,因为题目有上百道,序号就有2位数,3位数的,2位数以上的自己带有顿号的就出问题了,比如22、处理后就变成2、2、了,这个是怎么回事呢?

TOP

回复 4# jzp820927


    直接回复我的帖子就行了,不用PM我。

TOP

回复 4# jzp820927


试试这个:
  1. sed -r "s/^([0-9]+)([^、0-9])/\1、\2/"  a.txt > b.txt
复制代码
1

评分人数

TOP

这个没问题了,终于搞定了,今天评不了分了,明天再评分。

TOP

返回列表