使用挖空模型解析html页面

时间:2013-06-11 14:40:05

标签: knockout.js html-agility-pack

我尝试使用 html agility pack 解析html-page,我想从element获取一些值,但这个值在knockout模型中设置。

//...
function jsCycle(cycleid /* another variables */) {
        this.CycleYearID = ko.observable(cycleid);
        /* another variables */
    };

var c1 = new jsCycle('1edb0cc2-82af-e211-896a-3c4a92dbdc51'/* another variables */); 

ko.applyBindings(c1, $('#BoundCycleAreaOne')[0]);
jsModel.cycles.push(c1);
//...

我可以获得'#BoundCycleAreaOne'元素:

var period = document.QuerySelectorAll("#BoundCycleAreaOne");

但我也需要他的CycleYearID。我怎么能得到它?

1 个答案:

答案 0 :(得分:2)

仅使用HtmlAgilityPack.html文件是不可能的。

虽然HtmlAgilityPack可以解析HTML,但它根本无法运行JS代码。

您可以使用Selenium之类的工具等待一段时间,直到KnockoutJS填充页面,然后获取源并将其提供给HtmlAgilityPack