我从我正在关注的在线课程中下载了一些数据。
解压后,它会生成一个名为home.gl的文件夹(该文件夹附带gl扩展名),在该文件夹中,它们是这些奇怪的扩展文件。在课程中他们使用graphlab(付费程序),但他们说也可以使用Pandas。
这是可以加载到DataFrame中的数据,实际上只是加载它:
sales = graphlab.SFrame('home_data.gl/')
如何将这些数据加载到Python中,最好是pandas?
这些是他们的指示。
答案 0 :(得分:12)
您始终可以将SFrame保存到csv并从csv创建pandas DataFrame:
sf = sframe.SFrame('Downloads/home_data.gl/')
sf.save('Downloads/home_data.csv', format='csv')
df = pandas.read_csv('Downloads/home_data.csv')
答案 1 :(得分:1)
截至2018/05,turicreate
的更新回答运行pip install turicreate
。然后
In [1]: import turicreate as tc
In [2]: data = tc.SFrame('./case_study_approach/week2/home_data.gl/')
In [4]: data.save('./case_study_approach/week2/home_data.csv', format='csv')
In [5]: !less ./case_study_approach/week2/home_data.csv
这个包很好地支持很多平台。安装说明更好,更清洁。 SFrame已被弃用,无法在Linux上安装。
答案 2 :(得分:0)
明白你的意思......采取相同的方针,并想知道如何做到这一点。我的发现:SFrame包是根据BSD许可证授权的:)
这是我做的:
pip install -U sframe
然后在ipython notebook中:
import sframe
people = sframe.SFrame('people_wiki.gl/')
有效。
答案 3 :(得分:0)
此时我尝试导入sframe,但出现以下错误:
没有名为' sframe'
的模块
我尝试使用以下内容安装sframe
:
pip install -U sframe
您无法使用conda
在Linux或Windows上安装sframe
,但在Mac设备上除外。
长话短说我遇到了不同的错误。
我在这里说,因为此数据集来自graphlab create
或SFrame
,您可以使用以下代码graphlab create
:
import graphlab
sf = graphlab.SFrame('home_data.gl/')
sf.save('home_data.csv' , format = 'csv')
对于有权访问Online iPython Notebook
的用户,无需安装ghraphlab create
。只需按原样使用它,您就可以在笔记本中获得home_data.csv
数据集。
答案 4 :(得分:0)
if you are taking the Coursera course, either enrolled or auditing - they have provided link to get grapghlab create with free student license valid for a year. And if you dont want to store it locally, you can avail the aws hosted free tier.