从R Notebook访问Azure Blob存储

时间:2019-02-24 12:07:26

标签: r azure azure-storage sparkr

在python中,这就是我如何从Azure blob访问CSV

storage_account_name = "testname"
storage_account_access_key = "..."
file_location = "wasb://example@testname.blob.core.windows.net/testfile.csv"

spark.conf.set(
  "fs.azure.account.key."+storage_account_name+".blob.core.windows.net",
  storage_account_access_key)

df = spark.read.format('csv').load(file_location, header = True, inferSchema = True)

如何在R中做到这一点?我找不到任何文档...

2 个答案:

答案 0 :(得分:1)

AzureStor软件包为Azure存储提供了R接口,包括文件,blob和ADLSgen2。

matplotlib

请注意,这将下载到本地存储中的文件。从那里,您可以使用标准的Sparklyr方法摄取Spark。

免责声明:我是AzureStor的作者。

答案 1 :(得分:0)

如果您不想下载它,请创建一个临时文件然后从中读取

   endp <- storage_endpoint("https://acctname.blob.core.windows.net", key="access_key")
   cont <- storage_container(endp, "mycontainer")
   fname <- tempfile()
   storage_download(cont, "myblob.csv", fname)
   df = read.csv(fname)