我正试图将文件从此站点http://nemweb.com.au/Reports/Current/Daily_Reports/复制到我的azure blob存储帐户
我的第一个选择是尝试使用Azure数据工厂,但是最终复制了html,显然不是我想要的html,而是其中的zip文件
我的问题是ADF是实现这一目标的正确工具,或者如果我看看其他内容,那么任何方向都将非常感激。
当前,我正在使用Powerquery读取数据,这很不错,不幸的是,PowerBI服务需要刷新网关,这对我而言不是很实际,因此,我正在Microsoft数据堆栈中寻找其他选项< / p>
edit:我正在使用python路由,但很高兴听到其他选择
答案 0 :(得分:1)
我认为我找到了解决方案Python,它与azure blob集成良好,并且下载文件的代码非常简单,现在我需要弄清楚哪种方法是在python上运行python脚本的最佳服务。云
import re
import urllib.request
from urllib.request import urlopen
url = "http://nemweb.com.au/Reports/Current/Daily_Reports/"
result = urlopen(url).read().decode('utf-8')
pattern = re.compile(r'[\w.]*.zip')
filelist = pattern.findall(result )
for x in filelist:
urllib.request.urlretrieve(url+x, x)