找到一个C#HTML解析器找到所有<script>并给我行和位置信息</script>

时间:2010-09-11 08:28:17

标签: html parsing

<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
<head>
<title>title</title>
</head>
<body>
    <a href="aaa.asp?id=1"> I want to get this text </a>
    <script>
    var test=function()
        {}
    </script>
</body>
</html>

结果是: 行:7, 职位:4 含量:

var test=function()
{}

1 个答案:

答案 0 :(得分:2)

您是否尝试过HTML Agility Pack

这通常效果很好,并为您提供了解析HTML内容的直观界面。

你应该可以使用这样的东西:

 HtmlDocument doc = new HtmlDocument();
 doc.Load("yourfile.html");

 foreach(HtmlNode link in doc.DocumentElement.SelectNodes("//script)
 {
    // do something with your script nodes
 }