我刚刚开始学习数据科学,并且打算尝试解决泰坦尼克号问题。但是,我不太了解如何导入数据集,甚至不知道在何处存储下载的数据集。现在,我在DataScience文件夹中创建了一个名为input的文件夹,并将训练集和测试集存储在其中。但是当我进入pyCharm时,找不到该文件夹。
我试图编写代码
dataset = pd.read_cvs(.../input/train.cvs)
但是它只是说
“未解决的参考“火车”
,那么我应该将数据集保存在哪里以及如何在Python中访问它?
答案 0 :(得分:0)
如果我是您,我将尝试查找工作目录。工作目录是环境的默认文件夹。如果您不知道工作目录,那么这可能会对您有所帮助
https://www.jetbrains.com/help/pycharm/2016.2/creating-and-editing-run-debug-configurations.html
此外,您可以通过以下方式使用文件的默认地址:只需转到地址栏并复制并粘贴,即可查看文件在Windows文件夹中的位置:
dataset = pd.read_cvs(C:/Users/'username'/Desktop/input/train.cvs)
提供完整的地址,我认为它应该起作用。 另外,由于您是新手,因此使用Jupyter Hub Notebook比pycharm更容易。这是我的个人看法。
答案 1 :(得分:0)
您忘记了引号 数据集= pd.read_csv('... / input / train.cvs',encoding =“ utf-8”,header = None)