找回密码
 注册
搜索
[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
查看: 24126|回复: 8

[文本处理] [求助]抓爱词霸 页面信息

[复制链接]
发表于 2012-11-1 23:42:21 | 显示全部楼层 |阅读模式
http://www.iciba.com/batch 的信息抓下来,
获取 batch 的单词解释
三方工具提供如下: wget  awk  grep  sed  iconv
                           或者 精简版perl5.6(perl.exe perl56.dll 下载http://ishare.iask.sina.com.cn/f/14534556.html)
                           vbs 也可
发表于 2012-11-2 01:14:53 | 显示全部楼层
本帖最后由 tmplinshi 于 2012-11-2 01:27 编辑
  1. curl http://dict-co.iciba.com/api/dictionary.php?w=batch -s | iconv -f utf-8 -c | sed -n -r "s/^<acceptation>(.*)(<\/acceptation>)?$/\1/p"
复制代码
  1. wget -O - http://dict-co.iciba.com/api/dictionary.php?w=batch -q | iconv -f utf-8 -c | sed -n -r "s/^<acceptation>(.*)(<\/acceptation>)?$/\1/p"
复制代码
 楼主| 发表于 2012-11-2 20:19:00 | 显示全部楼层
谢谢,
http://dict-co.iciba.com/api/dictionary.php?w=batch

你 是 如何 分析出 这个 url的?
发表于 2012-11-2 20:37:52 | 显示全部楼层
本帖最后由 tmplinshi 于 2012-11-2 20:41 编辑

回复 3# lllsoslll


    在 Google 里搜索 爱词霸 api 找到的。
 楼主| 发表于 2012-11-3 11:20:45 | 显示全部楼层
在这个帖子中,sed 如何非贪婪匹配?
  1. <?xml version="1.0" encoding="UTF-8"?>
  2. <dict num="219" id="219" name="219">
  3. <key>batch</key>
  4. <p>
  5. 1234567890234567
  6. </p>
  7. aaaaaaa
  8. <p>
  9. <ps>bt</ps>
复制代码
替换为
  1. batch
  2. bt
  3. 1234567890234567
  4. aaaaaaa
复制代码
发表于 2012-11-3 12:22:44 | 显示全部楼层
本帖最后由 tmplinshi 于 2012-11-3 12:24 编辑

回复 5# lllsoslll


    <?xml version="1.0" encoding="UTF-8"?>
<dict num="219" id="219" name="219">
<key>batch</key>
<p>
1234567890234567
</p>
aaaaaaa
<p>

<ps>bt</ps>
红色部分是怎么来的?

这样?
  1. sed "s/<[^>]*>//g"
复制代码
 楼主| 发表于 2012-11-3 19:30:14 | 显示全部楼层
这个api 很不稳定啊, 有时候返回的结果有例句,有时候又没有, 有时候会阻塞很长时间,
发表于 2012-11-4 03:53:40 | 显示全部楼层
在此膜拜一下老大的思路,我是肯定想不到查找后加个API的,
发表于 2012-11-4 08:55:43 | 显示全部楼层
这个api 很不稳定啊, 有时候返回的结果有例句,有时候又没有, 有时候会阻塞很长时间,
lllsoslll 发表于 2012-11-3 19:30


我也发现经常响应很慢。
  1. wget -O - -q http://www.iciba.com/batch | sed -n -r "/^\t{3,}<label>/!d; s/^[^>]*>(.*)<.*$/\1/p" | iconv -f utf-8 | sed -n "H;${g;s/;\n/;/g;p}"
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|批处理之家 ( 渝ICP备10000708号 )

GMT+8, 2026-3-19 16:41 , Processed in 0.016418 second(s), 8 queries , File On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表