返回列表 发帖

[技术讨论] VBS 正则匹配失败竟会导致脚本暂停

data = ReadTextFile("match_stop.txt")
set ms = RegExMatch(data, "class=""smallphoto"" id=""(.*?)"".*?src=""(.*?)""[\s\S]*?author=""(.*?)""[\s\S]*?photoCName"">[\s\S]*?"">(.*?)<[\s\S]*?photoLName"">[\s\S]*?href=""(.*?)""[\s\S]*?class=""LatinName"">(.*?)<")
MsgBox ms.count
' 去掉末尾的【""LatinName"">(.*?)<】则正常
' set ms = RegExMatch(data, "class=""smallphoto"" id=""(.*?)"".*?src=""(.*?)""[\s\S]*?author=""(.*?)""[\s\S]*?photoCName"">[\s\S]*?"">(.*?)<[\s\S]*?photoLName"">[\s\S]*?href=""(.*?)""[\s\S]*?class=")
Function RegExMatch(ByRef inputstr, Pattern)
Set re = New RegExp
re.Pattern = Pattern
re.IgnoreCase = True
re.Global = True
MsgBox "呵呵呵,脚本要停止运行了..下面的 MsgBox 你看不见了."
Set RegExMatch = re.Execute( inputstr )
MsgBox "你看不见我,你看不见我"
End Function
Function ReadTextFile(fPath)
Set filesys = CreateObject("Scripting.FileSystemObject")
Set filetxt = filesys.OpenTextFile(fPath, 1)
ReadTextFile = filetxt.ReadAll
End FunctionCOPY

测试下面这段好像正常的哟
data = "fasdfasdf"&vbCrLf&"_ffsafdwsaf"
set ms = RegExMatch(data, "asdfasdf@<")
MsgBox ms.count
Function RegExMatch(ByRef inputstr, Pattern)
Set re = New RegExp
re.Pattern = Pattern
re.IgnoreCase = True
re.Global = True
MsgBox "呵呵呵,脚本要停止运行了..下面的 MsgBox 你看不见了."
Set RegExMatch = re.Execute( inputstr )
MsgBox "你看不见我,你看不见我"
End FunctionCOPY

TOP

是的,并不是所有情况都会导致脚本暂停。可是我顶楼给出的例子就是会导致脚本暂停。

TOP

这不是 VBS 的问题。
目测表达式太长、或其他未知的表达式错误。
『千江有水千江月』千江有水,月映千江;万里无云,万里青天。    http://yu2n.qiniudn.com/

TOP

本帖最后由 tmplinshi 于 2015-4-16 01:41 编辑

回复 4# yu2n
并不是目标表达式太长,如果我把表达式换成下面这行则运行正常、匹配成功(以下表达式比原来的还长):
set ms = RegExMatch(data, "class=""smallphoto"" id=""(.*?)"".*?src=""(.*?)""[\s\S]*?author=""(.*?)""[\s\S]*?photoCName"">[\s\S]*?"">(.*?)<[\s\S]*?photoLName"">[\s\S]*?href=""(.*?)""[\s\S]*?class=""plantname"".*?>(.*?)<")


脚本暂停,仅仅是表达式的末尾部分“LatinName"">(.*?)<”在源文件中找不到。既然找不到,正常情况 VBS 应该处理为匹配失败,而不是把脚本暂停了。

代码语法也并没有错误。既然代码语法没有错误,那么正则匹配无非两种结果——成功或者失败,“表达式错误”那就应该处理为匹配失败。

所以这当然是 VBS 的问题。

TOP

本帖最后由 tmplinshi 于 2015-4-16 02:50 编辑

知道原因了,是因为达到了匹配的最大(长度?)限制,导致 VBS 卡住了。我用那个表达式在 AutoHotkey 中进行匹配也返回了 -8 的 ErrorLevel 值("reached match limit" (-8))。

试了下添加“On error resume Next”并没有效果,有方法忽略这个错误吗?

=====================================

匹配过程估计是这样:
由于数据中有比较多的 [\s\S]*?class="",但是数据中并没有 [\s\S]*?class=""LatinName,所以电脑不停地往前搜索 [\s\S]*?class="",结果到达了匹配的最大长度限制。

TOP

返回列表