Question

我有一个csv文件，我正在尝试创建一个用于scikit-learn的数据集。

加载这些包：

import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
from sklearn import datasets, linear_model

我试过了：

sales = pd.read_csv("sales.csv") 
dataset = np.loadtxt(sales, delimiter=",")

它给了我这个错误：

AttributeError：'DataFrame'对象没有属性'endswith'

请帮忙！我没有找到如何从csv文件创建数据集的运气。

谢谢！

修改

澄清 - 我尝试按照此过程http://scikit-learn.org/stable/auto_examples/linear_model/plot_ols.html，除了我想使用自己的数据。我想知道如何将csv变成python数据集，如果可能的话。

Answer 1

在您的情况下，sales是您可能正在寻找的DataFrame。您可以操作它，例如尝试打印sales.columns。

Answer 2

基本上，销售已经是数据集。您正在尝试传递dataframe对象来代替文件名。因此，您可以直接将销售用作数据集，因为它将包含要素和标签或

dataset = np.loadtxt('sales.csv', delimiter=",")

如果你有正确的数据格式，这两种方法都可以。