Excel导入无法识别表

时间:2016-06-02 22:33:23

标签: excel import

我试图将网络数据导入excel - 特别是10天的天气预报,我试图以最简单的方式进行。我已经阅读了一些excel教程,只需点击“获取外部数据" "来自网络"然后当网站出现时,任何表格旁边都应该有一个箭头,我可以导入到excel。我的问题是,从来没有任何箭头。它为我提供了导入整个页面的选项,但是当我这样做时,它只会选择一些关键字,而不是我需要的任何温度数据。

理想情况下,我希望能够每天刷新以获得新的10天预测,但也要保留前一天的数据,但这有点超出我现在所处的位置,所以我想我最关心的是为什么网站上没有可导入的表格。大多数网站都将他们的10天预测组织在一个表格中,所以我假设(错误地)excel会选择将其作为导入内容。

我不知道这是否相关,但有时候我在excel网页查询窗口中打开了我想要的页面后,我会弹出一个说“脚本错误 - 有时会给出一个错误信息,有时不是,取决于页面 - 我尝试选择是和否,它似乎不会改变任何方式。有时它只出现一次,有时无论我选择哪种,我都会一遍又一遍地弹出。如果它最终消失了,无论我选择什么,仍然没有箭头来导入表格。无论如何,我不知道这是否与我的其他问题有关。

我的主要问题是:有没有办法导入这些表,即使excel不建议导入它们?或者,我是否必须采取某种网络刮/使用beautifulsoup或其他什么?如果重要的话,我正在使用excel 2013。

1 个答案:

答案 0 :(得分:0)

现代网页开发通常不会使用<table>标记进行布局控制,但您想要使用的向导最有可能只依赖于该标记..很可能没有这样的标记你要抓的网站上的标签。要验证这一点,您可以在您喜欢的浏览器中打开网站并查看该网站的HTML源代码。寻找<table>

  

有没有办法导入这些表,即使excel不建议导入它们?

是的,但需要一些编程。如果您对C#(或任何基于.NET的语言)感到满意(或愿意学习),请查看HTML Agility Pack。它是一个优秀的免费图书馆,仅用于此类任务。

注意

屏幕抓取始终是一个棘手的问题,因为您的代码依赖于用户界面的结构,网站开发人员可能会不时更改。请注意这种可能性。