我正在尝试为 Excel 文件生成 Blob SAS URL,以读取数据框中的数据。 我正在使用下面的 python 代码,它在将 URL 值传递给 read_excel 函数时抛出错误 “HTTPError:服务器无法对请求进行身份验证。确保正确形成授权标头的值,包括签名。”
代码:
from azure.storage.blob import generate_blob_sas
from azure.storage.blob import BlobServiceClient, ResourceTypes, AccountSasPermissions
from datetime import datetime, timedelta,date
import pandas as pd
blob_name=<Blobname>
account_name=<accountname>
account_key=<accountkey>
container_name=<blobname>
sas_blob = generate_blob_sas(account_name=account_name,
container_name=container_name,
blob_name=blob_name,
account_key=account_key,
resource_types=ResourceTypes(object=True),
permission=AccountSasPermissions(read=True),
expiry=datetime.utcnow() + timedelta(hours=1))
blob = generate_blob_sas(account_name,account_key, container_name, blob_name,sas_blob)
blob_service_client = BlobServiceClient(account_url="https://<account_name>.blob.core.windows.net", credential=sas_blob)
url = 'https://'+account_name+'.blob.core.windows.net/'+container_name+'/'+blob_name+'?'+sas_blob
print(url)
df=pd.read_excel(url, sheet_name='test',usecols=(cols),header=6)
错误 失败的 C:\WPy64-3800\python-3.8.0.amd64\lib\site-packages\azure\storage\blob\baseblobservice.py:1009:语法警告:“不是”带有文字。你的意思是“!=”?如果lease_duration 不是-1 并且\C:\WPy64-3800\python-3.8.0.amd64\lib\site-packages\azure\storage\blob\baseblobservice.py:2660:SyntaxWarning:“不是”带有文字.你的意思是“!=”?如果lease_duration 不是-1 并且\C:\WPy64-3800\python-3.8.0.amd64\lib\site-packages\azure\storage\common_connection.py:82: SyntaxWarning: "is" 带有文字。您指的是“==”吗? self.protocol = self.protocol 如果 parsed_url.scheme 是 '' else parsed_url.schemeTraceback(最近一次调用最后一次):文件“C:\Temp\rid04ztb.tl0\005b3440-f226-432b-b554-d625411linefdb58,”在 df=pd.read_excel(url, sheet_name='test',usecols=(cols),header=6) 文件“C:\WPy64-3800\python-3.8.0.amd64\lib\site-packages\pandas\ util_decorators.py", line 299, in wrapper return func(*args, **kwargs) File "C:\WPy64-3800\python-3.8.0.amd64\lib\site-packages\pandas\io\excel_base.py ",第 336 行,在 read_excel io = ExcelFile(io, storage_options=storage_options, engine=engine) 文件 "C:\WPy64-3800\python-3.8.0.amd64\lib\site-packages\pandas\io\excel_base. py”,第 1071 行,在 init ext = inspect_excel_format( 文件“C:\WPy64-3800\python-3.8.0.amd64\lib\site-packages\pandas\io\excel_base.py” ,第 949 行,inspect_excel_format with get_handle( File "C:\WPy64-3800\python-3.8.0.amd64\lib\site-packages\pandas\io\common.py", line 558, in get_handle ioargs = _get_filepath_or _buffer( 文件“C:\WPy64-3800\python-3.8.0.amd64\lib\site-packages\pandas\io\common.py”,第 289 行,在 _get_filepath_or_buffer req = urlopen(filepath_or_buffer) 文件“C:\ WPy64-3800\python-3.8.0.amd64\lib\site-packages\pandas\io\common.py”,第 195 行,在 urlopen 中返回 urllib.request.urlopen(*args, **kwargs) 文件“C: \WPy64-3800\python-3.8.0.amd64\lib\urllib\request.py",第 222 行,在 urlopen 中返回 opener.open(url, data, timeout) 文件 "C:\WPy64-3800\python-3.8 .0.amd64\lib\urllib\request.py”,第 531 行,打开 response = meth(req, response) 文件“C:\WPy64-3800\python-3.8.0.amd64\lib\urllib\request。 py”,第 640 行,在 http_response response = self.parent.error( 文件“C:\WPy64-3800\python-3.8.0.amd64\lib\urllib\request.py”,第 569 行,错误返回 self. _call_chain(*args) 文件“C:\WPy64-3800\python-3.8.0.amd64\lib\urllib\request.py”,第 502 行,在 _call_chain 结果 = func(*args) 文件“C:\WPy64- 3800\python-3.8.0.amd64\lib\urllib\request.py”,第 649 行,在 http_error_d efault 引发 HTTPError(req.full_url, code, msg, hdrs, fp)urllib.error.HTTPError:HTTP 错误 403:服务器无法验证请求。确保 Authorization 标头的值正确形成,包括签名。
任何帮助表示赞赏。提前致谢。
答案 0 :(得分:0)
我相信您收到此错误是因为您将服务 SAS 与帐户 SAS 混合使用。您的 generate_blob_sas
方法中不需要 resource_types
,而且 permission
类型应该是 BlobSasPermissions
。
请尝试以下代码:
from azure.storage.blob import generate_blob_sas
from azure.storage.blob import BlobServiceClient, ResourceTypes, BlobSasPermissions
from datetime import datetime, timedelta,date
import pandas as pd
blob_name=<Blobname>
account_name=<accountname>
account_key=<accountkey>
container_name=<blobname>
sas_blob = generate_blob_sas(account_name=account_name,
container_name=container_name,
blob_name=blob_name,
account_key=account_key,
permission=BlobSasPermissions(read=True),
expiry=datetime.utcnow() + timedelta(hours=1))