[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[问题求助] VBS如何下载带UNICODE字符的网页数据?

  1. With CreateObject("WinHttp.WinHttpRequest.5.1")
  2.         .Open "GET", "http://dict.qq.com/dict?q=word", False
  3.         .send
  4.          tt = .responseText '发现网页上的使用UNICODE的字符被WINHTTP组件自动转为GB字符了...
  5.   with
复制代码
我想下载这个网页的音标(wə:d)保存到文本文件中去的...注:这个音标是UNICODE字符..

本帖最后由 czjt1234 于 2013-7-28 19:52 编辑

源文件就是这样的、

["w& #601;:d"]

QQ 20147578

TOP

回复 2# czjt1234


    呀,..

那怎么把源文件转成 正常识别的数据wə:d呢?
另外,我直接打开,发现源文件是wə:d呀..

TOP

回复 3# lqh123108
    按照英语音标需要的常用特殊字符,手动替换即可。
IPA符号
http://www.fmddlmyy.cn/text65.html

4.1 概述
这里的IPA指的是“International Phonetic Alphabet”。IPA也是International Phonetic Association的缩写。IPA符号就是这个协会整理的一套用来表示语音的标准符号。 根据Wikipedia,在2008年,IPA符号包括107个字母,52个音调符号(diacritics)和4个韵律标记(prosody marks)。 有一个关于"The International Phonetic Alphabet in Unicode"的网页上面有IPA符号对应的Unicode字符的列表。 还有个网页提供了IPA字符输入功能。 只要点击网页上的字符,字符就会出现在下方的编辑框中。

英语音标需要的特殊字符
因为英语音标系统需要一些ascii字符以外的符号,这些符号在Unicode出现前没有统一的编码和相应的字体,需要用特殊字体实现。所以在音标的输入和显示上造成了一定的混乱。 那么英语音标究竟需要哪些特殊字符呢?下表列出了英语音标需要的常用特殊字符。

音标符号        10进制Unicode编码        16进制Unicode编码
æ        230        00E6
e        240        00F0
ŋ        331        014B
ɑ        593        0251
ɒ        594        0252
ɔ        596        0254
ə        601        0259
ɛ        603        025B
ɜ        604        025C
ɡ        609        0261
ɪ        618        026A
ʃ        643        0283
ʊ        650        028A
ʌ        652        028C
ʒ        658        0292
ˈ        712        02C8
ˌ        716        02CC
ː        720        02D0
θ        952        03B8

网页代码转IPA代码如下(贴代码无法显示,请下载附档,另注意VBS应保存为Unicode编码):
『千江有水千江月』千江有水,月映千江;万里无云,万里青天。    http://yu2n.qiniudn.com/

TOP

多谢了

TOP

学习了,谢谢

TOP

返回列表