如何使用azureml上传的数据集到pandas进行分析?

时间:2018-05-05 12:36:44

标签: python python-3.x pandas azure azure-machine-learning-studio

我已经通过microsoft将数据集上传到AzureMl。现在问题是我想在笔记本中使用该数据集(.csv)(也由azureml提供)。但我无法找到办法。 它提供了一种通过以下方式访问它的方法:

from azureml import Workspace

ws = Workspace(
    workspace_id='777902b8d48a449091a57d13bfcdfdec',
    authorization_token='c05837974f984e4eb6a4df85a97642dd',
    endpoint='https://studioapi.azureml.net'
)
ds = ws.datasets['temp.csv']
frame = ds.to_dataframe()

当我做的时候:

type(frame)

它显示:pandas.core.frame.DataFrame

但我希望它以CSV的形式出现。所以我从头开始。所以,我用: frame.to_csv('temp.csv')

有没有其他方法可以在azureml中的pandas中使用上传的数据集?

2 个答案:

答案 0 :(得分:0)

您可以使用“转换为CSV”模块并下载数据集。

enter image description here

要在Azure笔记本中使用,您要在要使用的库中上传CSV。

enter image description here

要在笔记本中访问,您可以引用文件名以读取CSV。

enter image description here

答案 1 :(得分:0)

您可以使用ds.to_dataframe()访问文件的原始文本数据,而不是ds.read_as_text()。您当然必须自己解析文本文件:

  • ds.to_dataframe()
    enter image description here
  • ds.read_as_text()
    enter image description here