ImportXML获取内容无法使用Google表格进行解析

时间:2016-06-17 09:38:00

标签: xml twitter import google-sheets screen-scraping

我似乎无法获得Twitter生物并获得“内容无法解析”。我可以获得与Twitter帐户相关的喜欢。

我正在使用的线路有什么问题?

=importXML("http://twitter.com/"&substitute(A4,"@","",2),"//p[@class=’ProfileHeaderCard-bio u-dir’]")

A4 = jaredhuet in google sheets。

1 个答案:

答案 0 :(得分:1)

它与twitter无法合作的实际原因是因为它在源代码中没有正确格式化,它是malformed xml因此它只能用importxml解析,但是下面的公式会让你得到同样的东西,它会处理更快更容易,因为加载和筛选的数据更少。

将twitter.com部分替换为:

"https://twitter.com/intent/user?screen_name="&A41

完整的公式是:

=IMPORTXML("https://twitter.com/intent/user?screen_name="&A4,"//*[@class='note']")

enter image description here

请注意,@符号不会影响页面是否加载,但这里是获取该部分的工作公式:

enter image description here