我尝试将数据从网页导入Power BI Desktop。 URL如下:
https://casa.sapo.pt/Venda/Apartamentos/Maia/?sa=13
它包含有关房价,特征等的数据。
查询返回一个空表,但是如果我浏览到任何浏览器的页面而没有身份验证或登录,我看到它包含我想要分析的数据,所以我猜发布者已经以某种方式禁用了查询我试图制作。
有没有人知道解决方法?
答案 0 :(得分:1)
Power BI / Power Query对于相当典型的页面结构给出了相当令人失望的结果。它似乎只适用于“Web 1.0”样式的HTML表格。周围(维基百科之外)的人很少,几乎没有意义......
您可以尝试使用Chris Webb的ExpandAll功能(下面的链接)来扩展所有可用数据。
http://blog.crossjoin.co.uk/2014/05/21/expanding-all-columns-in-a-table-in-power-query/
然后你可以排除所有非“.Text”列并将它们合并在一起以从一页中的页面中获取所有文本 - 但很难理解它。您还会丢失很多HTML内容,例如链接,图片网址。