我在网上搜索过,无法找到简单的HTMLAgilityPack示例从网页中提取1条信息。大多数示例都在C#中,代码转换器无法正常工作。此外,开发者论坛也没有帮助。
无论如何,我试图从这个URL“http://quotes.morningstar.com/stock/c-company-profile?t=dltr”中提取“消费者防御”字符串,而本文“Dollar Tree Stores,Inc。”在美国和加拿大经营折扣品种商店。其商店以1.00美元和1.25加元的固定价格提供商品。该公司以Dollar Tree,Deal $,Dollar Tree Canada等名义经营商店,“来自同一网页。
尝试此链接上的代码:https://stackoverflow.com/questions/13147749/html-agility-pack-with-vb-net-parsing但未声明GetPageHTML
。
这个是在C#HTML Agility pack - parsing tables
等等。
感谢。
答案 0 :(得分:1)
从该URL返回的HTML被转换为具有2个根节点的XML,因此无法直接转换为XML文档。
对于您希望检索的值,可能更容易简单地检索HTML文档并搜索您要提取的字符串的开始和结束标记。