Question

我正在尝试解析特定网站上的某些HTML。

我从网站上获取所有内容并将其保存为此行的NSData。

NSData *testData = [NSData dataWithContentsOfURL:[NSURL URLWithString:@"http://somewebsite/"]];

我使用TFHipple Scraper遍历HTML中的每个元素，这很好。我可以看到一切。

当我找到我正在寻找的特定元素时，它有5个键/值对，如预期，使用网站上的开发工具进行验证。刮刀看到的是前四个，它们的正确值就好了。

这是问题，当它到达最后一个键/值对时，“href”它总是为空。这包含我想要提取的链接。

一位同事建议，可能有些JS在页面加载后注入链接，但我找不到任何支持这个想法的东西。

知道为什么“href”会为null，但其他一切都完全加载了？

Answer 1

响应数据看起来像JavaScript，而不是HTML。我不认为TFHipple会解析它。您可以尝试使用JavaScriptCore。 NSHipster有a really good writeup on it。