Board logo

标题: [文本处理] 批处理将网址分列输出为TXT文本文件 [打印本页]

作者: 447219071    时间: 2018-4-22 12:11     标题: 批处理将网址分列输出为TXT文本文件

本帖最后由 447219071 于 2022-10-25 09:31 编辑

如网址用url代表吧   http://qq.com/?so&360.html+http://163.com/?360.html+http://163.com/?1000+http://gppgle.com/?src=lm&ls=n4+http://baba.com/?un_374_88
我想将上面的URL提取如下TXT文本,请大神指教,谢谢
  1. http://qq.com/?so&360.html
  2. http://163.com/?360.html
  3. http://163.com/?1000
  4. http://gppgle.com/?src=lm&ls=n4
  5. http://baba.com/?un_374_88[/code】
  6. [code]<cpulink>start "" http://www.2345.com/?kq10000,start "" "http://hao.7654.com/?chno=7654dh_139888",start "" "https://yeah.qq.com/?q=110513",start "" http://www.sejai.com/?2417,start "" "https://yeah.qq.com/s.html?q=110513",start "" "http://hao.360.cn/?src=lm&ls=n4f12a8a094"<cpulink>
复制代码

作者: hlzj88    时间: 2018-4-23 21:14

对文本的加号进行替换,+替换为<p>,文本保存为html,打开就是你要的结果,复制再保存。
作者: 窄口牛    时间: 2018-4-24 07:59

用word把+替换成^p,岂不是更好?
作者: hfxiang    时间: 2022-10-25 11:08

把 (http://qq.com/?so&360.html+h ... baba.com/?un_374_88) 保存为"a.txt",编码格式为ANSI,用gawk( http://bcn.bathome.net/tool/4.1.0/gawk.exe )可实现楼主第01~05行在[/code】之前的要求。[/code】及06行的要求,其源数据不知从何而来?
  1. gawk -F"+" -vOFS="\n" "{$1=$1}1" a.txt
复制代码





欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2