批处理之家 - Powered by Discuz! Board

标题: [问题求助] [已解决]sed怎样替换如</td>这种特殊字符串？ [打印本页]

作者: abxialiang 时间: 2010-7-5 10:10 标题: [已解决]sed怎样替换如</td>这种特殊字符串？

sed "s/^<^/td^>/789/g" 1.txt >2.txt
用这个不行，
sed "s/</td>/789/g" 1.txt >2.txt
这个也不行

[ 本帖最后由 abxialiang 于 2010-7-9 22:45 编辑 ]

作者: CUer 时间: 2010-7-5 10:23

sed "s#</td>#789#g" 1.txt >2.txt
复制代码

sed "s/<\/td>/789/g" 1.txt >2.txt
复制代码

作者: abxialiang 时间: 2010-7-5 11:48

谢谢，正是这样的，原来可以用特殊字符来进行分隔的啊

作者: abxialiang 时间: 2010-7-5 11:58

又遇到了一个新的问题，怎么替换如：”http://*****.com“这种结构的字符口串（*表示任意）

作者: CUer 时间: 2010-7-5 13:01

sed "s#http://.*\.com#789#g" 1.txt >2.txt
复制代码

作者: abxialiang 时间: 2010-7-5 13:15

这样的话存在一个问题，请看：
123456http://www.baidu.com789.com
我只想删除这些网址，但后面的789.com也被删除了。所以我希望只删除最近匹配的，而且每次只处理一行。（不应该是这行的http://与下一行的com）

作者: Batcher 时间: 2010-7-5 15:26 标题: 回复 6楼的帖子

能否把你的原始文件用附件的形式传上来看看？

作者: abxialiang 时间: 2010-7-5 17:01

我马上把附件传上来，我想把这个文本中的不是小说内容的东西全部去掉，但是小说本身的内容不能损坏。

作者: CUer 时间: 2010-7-6 22:56

sed "s/<[^>]\+>//g" 1.txt >2.txt
复制代码

作者: abxialiang 时间: 2010-7-7 09:38

非常佩服Cuer对sed 命令的熟悉程度，大部分的多余文字都已经去除了，请问这个语句里面的“\+>”有什么作用

作者: CUer 时间: 2010-7-7 20:37 标题: 正则基础

正则表达式使用详解
http://bbs.chinaunix.net/thread-63273-1-1.html

Regular Expression 简介
http://bbs.chinaunix.net/thread-605570-1-1.html

Regular Expression POSIX Extension
http://bbs.chinaunix.net/viewthread.php?tid=1617693#pid11506403

欢迎光临批处理之家 (http://bbs.bathome.net/)