我在这里发帖是因为我无法在这里发布。到目前为止在网上找到任何这样的场景。我有一个网页,其中包含一系列XLS和PDF格式的报告。我应该从页面下载excel文件并加载到我的数据库中。我希望我可以直接使用XLS文件的URL,但问题是命名约定可能每次都在变化(Sales_Quarter1.xlsx可能是明年的Sales_Q1.xlsx)。以下示例中唯一不变的是"日历年销售额#34;。我应该查找与此文本对应的文件,并在将其加载到数据库表之前下载它。
我想知道专家是否可以这样做?
<li>
<sub>Sales for Calendar Year 2015--All Countries </sub>
<a href="/Data/Downloads/Documents/Sales/Sales_Quarter1.xlsx">
<sub>[XLS]</sub></a><sub> , <a href="/Data/Downloads/Documents/Sales/Sales_Quarter1.pdf"><sub>[PDF]</sub></a><sub></sub></sub>
</li>
&#13;
PS:我正在使用SQL Server 2014。
谢谢!
答案 0 :(得分:0)
查看Integration Services。创建一个包,用于使用script task拉取网页,以及一个变量名称,该名称将代表您下载的html文件和excel文件的本地文件名(您还必须解析html中的链接)文件)。然后在包中使用Excel Source。
脚本任务中使用的excel文件的变量名称也需要设置为ReadWrite。
如果计划在重复的基础上运行此命令,将逻辑放入脚本或执行路径,您还可以通过SQL代理作业计划生成的包执行,