我正在尝试解析特定网站上的某些HTML。
我从网站上获取所有内容并将其保存为此行的NSData。
NSData *testData = [NSData dataWithContentsOfURL:[NSURL URLWithString:@"http://somewebsite/"]];
我使用TFHipple Scraper遍历HTML中的每个元素,这很好。我可以看到一切。
当我找到我正在寻找的特定元素时,它有5个键/值对,如预期,使用网站上的开发工具进行验证。刮刀看到的是前四个,它们的正确值就好了。
这是问题,当它到达最后一个键/值对时,“href”它总是为空。这包含我想要提取的链接。
一位同事建议,可能有些JS在页面加载后注入链接,但我找不到任何支持这个想法的东西。
知道为什么“href”会为null,但其他一切都完全加载了?
答案 0 :(得分:2)
响应数据看起来像JavaScript,而不是HTML。我不认为TFHipple会解析它。您可以尝试使用JavaScriptCore。 NSHipster有a really good writeup on it。