如何为存储在 Blob 容器中的 excel 文件生成 Blob SAS URL

时间:2021-06-16 05:35:43

标签: python-3.x pandas azure azure-sas

我正在尝试为 Excel 文件生成 Blob SAS URL,以读取数据框中的数据。 我正在使用下面的 python 代码,它在将 URL 值传递给 read_excel 函数时抛出错误 “HTTPError:服务器无法对请求进行身份验证。确保正确形成授权标头的值,包括签名。”

代码:

    from azure.storage.blob import generate_blob_sas
    from azure.storage.blob import BlobServiceClient, ResourceTypes, AccountSasPermissions
    from datetime import datetime, timedelta,date
    import pandas as pd
    
    blob_name=<Blobname>
    account_name=<accountname>
    account_key=<accountkey>
    container_name=<blobname>
    
    sas_blob = generate_blob_sas(account_name=account_name, 
                              container_name=container_name,
                                blob_name=blob_name,
                                account_key=account_key,
                                resource_types=ResourceTypes(object=True),
                                permission=AccountSasPermissions(read=True),
                               expiry=datetime.utcnow() + timedelta(hours=1))
    
    blob = generate_blob_sas(account_name,account_key, container_name, blob_name,sas_blob)
    blob_service_client = BlobServiceClient(account_url="https://<account_name>.blob.core.windows.net", credential=sas_blob)
    url = 'https://'+account_name+'.blob.core.windows.net/'+container_name+'/'+blob_name+'?'+sas_blob
    print(url)
    df=pd.read_excel(url, sheet_name='test',usecols=(cols),header=6)

错误 失败的 C:\WPy64-3800\python-3.8.0.amd64\lib\site-packages\azure\storage\blob\baseblobservice.py:1009:语法警告:“不是”带有文字。你的意思是“!=”?如果lease_duration 不是-1 并且\C:\WPy64-3800\python-3.8.0.amd64\lib\site-packages\azure\storage\blob\baseblobservice.py:2660:SyntaxWarning:“不是”带有文字.你的意思是“!=”?如果lease_duration 不是-1 并且\C:\WPy64-3800\python-3.8.0.amd64\lib\site-packages\azure\storage\common_connection.py:82: SyntaxWarning: "is" 带有文字。您指的是“==”吗? self.protocol = self.protocol 如果 parsed_url.scheme 是 '' else parsed_url.schemeTraceback(最近一次调用最后一次):文件“C:\Temp\rid04ztb.tl0\005b3440-f226-432b-b554-d625411linefdb58,”在 df=pd.read_excel(url, sheet_name='test',usecols=(cols),header=6) 文件“C:\WPy64-3800\python-3.8.0.amd64\lib\site-packages\pandas\ util_decorators.py", line 299, in wrapper return func(*args, **kwargs) File "C:\WPy64-3800\python-3.8.0.amd64\lib\site-packages\pandas\io\excel_base.py ",第 336 行,在 read_excel io = ExcelFile(io, storage_options=storage_options, engine=engine) 文件 "C:\WPy64-3800\python-3.8.0.amd64\lib\site-packages\pandas\io\excel_base. py”,第 1071 行,在 init ext = inspect_excel_format( 文件“C:\WPy64-3800\python-3.8.0.amd64\lib\site-packages\pandas\io\excel_base.py” ,第 949 行,inspect_excel_format with get_handle( File "C:\WPy64-3800\python-3.8.0.amd64\lib\site-packages\pandas\io\common.py", line 558, in get_handle ioargs = _get_filepath_or _buffer( 文件“C:\WPy64-3800\python-3.8.0.amd64\lib\site-packages\pandas\io\common.py”,第 289 行,在 _get_filepath_or_buffer req = urlopen(filepath_or_buffer) 文件“C:\ WPy64-3800\python-3.8.0.amd64\lib\site-packages\pandas\io\common.py”,第 195 行,在 urlopen 中返回 urllib.request.urlopen(*args, **kwargs) 文件“C: \WPy64-3800\python-3.8.0.amd64\lib\urllib\request.py",第 222 行,在 urlopen 中返回 opener.open(url, data, timeout) 文件 "C:\WPy64-3800\python-3.8 .0.amd64\lib\urllib\request.py”,第 531 行,打开 response = meth(req, response) 文件“C:\WPy64-3800\python-3.8.0.amd64\lib\urllib\request。 py”,第 640 行,在 http_response response = self.parent.error( 文件“C:\WPy64-3800\python-3.8.0.amd64\lib\urllib\request.py”,第 569 行,错误返回 self. _call_chain(*args) 文件“C:\WPy64-3800\python-3.8.0.amd64\lib\urllib\request.py”,第 502 行,在 _call_chain 结果 = func(*args) 文件“C:\WPy64- 3800\python-3.8.0.amd64\lib\urllib\request.py”,第 649 行,在 http_error_d efault 引发 HTTPError(req.full_url, code, msg, hdrs, fp)urllib.error.HTTPError:HTTP 错误 403:服务器无法验证请求。确保 Authorization 标头的值正确形成,包括签名。

任何帮助表示赞赏。提前致谢。

1 个答案:

答案 0 :(得分:0)

我相信您收到此错误是因为您将服务 SAS 与帐户 SAS 混合使用。您的 generate_blob_sas 方法中不需要 resource_types,而且 permission 类型应该是 BlobSasPermissions

请尝试以下代码:

from azure.storage.blob import generate_blob_sas
from azure.storage.blob import BlobServiceClient, ResourceTypes, BlobSasPermissions
from datetime import datetime, timedelta,date
import pandas as pd

blob_name=<Blobname>
account_name=<accountname>
account_key=<accountkey>
container_name=<blobname>

sas_blob = generate_blob_sas(account_name=account_name, 
                            container_name=container_name,
                            blob_name=blob_name,
                            account_key=account_key,
                            permission=BlobSasPermissions(read=True),
                            expiry=datetime.utcnow() + timedelta(hours=1))