导入泰坦尼克号数据集

时间:2018-09-26 06:30:25

标签: python dataset pycharm data-science

我刚刚开始学习数据科学,并且打算尝试解决泰坦尼克号问题。但是,我不太了解如何导入数据集,甚至不知道在何处存储下载的数据集。现在,我在DataScience文件夹中创建了一个名为input的文件夹,并将训练集和测试集存储在其中。但是当我进入pyCharm时,找不到该文件夹​​。

我试图编写代码

dataset = pd.read_cvs(.../input/train.cvs)

但是它只是说

  

“未解决的参考“火车”

,那么我应该将数据集保存在哪里以及如何在Python中访问它?

2 个答案:

答案 0 :(得分:0)

如果我是您,我将尝试查找工作目录。工作目录是环境的默认文件夹。如果您不知道工作目录,那么这可能会对您有所帮助

https://www.jetbrains.com/help/pycharm/2016.2/creating-and-editing-run-debug-configurations.html

此外,您可以通过以下方式使用文件的默认地址:只需转到地址栏并复制并粘贴,即可查看文件在Windows文件夹中的位置:

dataset = pd.read_cvs(C:/Users/'username'/Desktop/input/train.cvs)

提供完整的地址,我认为它应该起作用。 另外,由于您是新手,因此使用Jupyter Hub Notebook比pycharm更容易。这是我的个人看法。

答案 1 :(得分:0)

您忘记了引号  数据集= pd.read_csv('... / input / train.cvs',encoding =“ utf-8”,header = None)