在python或pandas中打开扩展名为.gl的文件夹

时间:2015-11-01 12:06:48

标签: python pandas

我从我正在关注的在线课程中下载了一些数据。

解压后,它会生成一个名为home.gl的文件夹(该文件夹附带gl扩展名),在该文件夹中,它们是这些奇怪的扩展文件。在课程中他们使用graphlab(付费程序),但他们说也可以使用Pandas。

这是可以加载到DataFrame中的数据,实际上只是加载它:

sales = graphlab.SFrame('home_data.gl/')

这是所提取内容的图像。 enter image description here

如何将这些数据加载到Python中,最好是pandas?

这些是他们的指示。

enter image description here

5 个答案:

答案 0 :(得分:12)

您始终可以将SFrame保存到csv并从csv创建pandas DataFrame:

sf = sframe.SFrame('Downloads/home_data.gl/') 
sf.save('Downloads/home_data.csv', format='csv')
df = pandas.read_csv('Downloads/home_data.csv')

答案 1 :(得分:1)

截至2018/05,turicreate

的更新回答

运行pip install turicreate。然后

In [1]: import turicreate as tc

In [2]: data = tc.SFrame('./case_study_approach/week2/home_data.gl/')

In [4]: data.save('./case_study_approach/week2/home_data.csv', format='csv')

In [5]: !less ./case_study_approach/week2/home_data.csv

这个包很好地支持很多平台。安装说明更好,更清洁。 SFrame已被弃用,无法在Linux上安装。

答案 2 :(得分:0)

明白你的意思......采取相同的方针,并想知道如何做到这一点。我的发现:SFrame包是根据BSD许可证授权的:)

这是我做的:

pip install -U sframe

然后在ipython notebook中:

import sframe

people = sframe.SFrame('people_wiki.gl/')

有效。

答案 3 :(得分:0)

此时我尝试导入sframe,但出现以下错误:

  

没有名为' sframe'

的模块

我尝试使用以下内容安装sframe

pip install -U sframe

您无法使用conda在Linux或Windows上安装sframe,但在Mac设备上除外。

长话短说我遇到了不同的错误。

我在这里说,因为此数据集来自graphlab createSFrame,您可以使用以下代码graphlab create

import graphlab

sf = graphlab.SFrame('home_data.gl/')
sf.save('home_data.csv' , format = 'csv')

对于有权访问Online iPython Notebook的用户,无需安装ghraphlab create。只需按原样使用它,您就可以在笔记本中获得home_data.csv数据集。

答案 4 :(得分:0)

if you are taking the Coursera course, either enrolled or auditing - they have provided link to get grapghlab create with free student license valid for a year. And if you dont want to store it locally, you can avail the aws hosted free tier.