解析HTML结构

时间:2011-11-07 09:15:37

标签: html actionscript-3 parsing html-parsing

我需要解析一个html源代码才能获得一些链接......

我们假设我们有:

<html>
<head>....</head>
<body>
  <div ....>
   ....
     <a href="link0">
     <div class="class1">
       <a href="link1">
      </div>
     <a href="link2">
  </div>
</body>
</html>

我只希望link1div的孩子class1

我真的无法理解......

3 个答案:

答案 0 :(得分:0)

我不知道动作脚本,但我建议你不要试图重新发明轮子。必须有一些XML解析器可用于actionscript。用它。首先,请参阅W3CSchools tutorial。我再说一遍 - 使用一个解析器,不要自己编写,除非你真的有一个很好的理由这样做。

答案 1 :(得分:0)

答案 2 :(得分:-1)

容易...

在ActionScript中,您需要将html源代码作为字符串。然后你需要使用正则表达式来查找div。

var s:String="my html source";
var regex:RegExp=/<div.*?class="class1".*?>.*?<a.*?href="(.*?)".*?>(.*?)<\/a>/gi;

var o:Array=regex.exec(s);

trace(o[1]); //Gives you the href
trace(o[2]); //Gives you the anchortext