如何将文件从网站复制到Azure Blob存储

时间:2019-06-16 04:37:54

标签: etl azure-storage-blobs powerquery azure-data-factory

我正试图将文件从此站点http://nemweb.com.au/Reports/Current/Daily_Reports/复制到我的azure blob存储帐户

我的第一个选择是尝试使用Azure数据工厂,但是最终复制了html,显然不是我想要的html,而是其中的zip文件

我的问题是ADF是实现这一目标的正确工具,或者如果我看看其他内容,那么任何方向都将非常感激。

当前,我正在使用Powerquery读取数据,这很不错,不幸的是,PowerBI服务需要刷新网关,这对我而言不是很实际,因此,我正在Microsoft数据堆栈中寻找其他选项< / p>

edit:我正在使用python路由,但很高兴听到其他选择

1 个答案:

答案 0 :(得分:1)

我认为我找到了解决方案Python,它与azure blob集成良好,并且下载文件的代码非常简单,现在我需要弄清楚哪种方法是在python上运行python脚本的最佳服务。云

import re
import urllib.request
from urllib.request import urlopen

url = "http://nemweb.com.au/Reports/Current/Daily_Reports/"
result = urlopen(url).read().decode('utf-8')

pattern = re.compile(r'[\w.]*.zip')
filelist = pattern.findall(result )
for x in filelist:
      urllib.request.urlretrieve(url+x, x)