如何从本地csv文件创建python数据集?

时间:2017-08-07 19:11:34

标签: python csv dataset

我有一个csv文件,我正在尝试创建一个用于scikit-learn的数据集。

加载这些包:

import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
from sklearn import datasets, linear_model

我试过了:

sales = pd.read_csv("sales.csv") 
dataset = np.loadtxt(sales, delimiter=",")

它给了我这个错误:

  

AttributeError:'DataFrame'对象没有属性'endswith'

请帮忙!我没有找到如何从csv文件创建数据集的运气。

谢谢!

修改

澄清 - 我尝试按照此过程http://scikit-learn.org/stable/auto_examples/linear_model/plot_ols.html,除了我想使用自己的数据。我想知道如何将csv变成python数据集,如果可能的话。

2 个答案:

答案 0 :(得分:0)

在您的情况下,sales是您可能正在寻找的DataFrame。您可以操作它,例如尝试打印sales.columns。

答案 1 :(得分:0)

基本上,销售已经是数据集。您正在尝试传递dataframe对象来代替文件名。因此,您可以直接将销售用作数据集,因为它将包含要素和标签或

dataset = np.loadtxt('sales.csv', delimiter=",")

如果你有正确的数据格式,这两种方法都可以。