我有一个csv
文件,我正在尝试创建一个用于scikit-learn
的数据集。
加载这些包:
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
from sklearn import datasets, linear_model
我试过了:
sales = pd.read_csv("sales.csv")
dataset = np.loadtxt(sales, delimiter=",")
它给了我这个错误:
AttributeError:'DataFrame'对象没有属性'endswith'
请帮忙!我没有找到如何从csv
文件创建数据集的运气。
谢谢!
修改
澄清 - 我尝试按照此过程http://scikit-learn.org/stable/auto_examples/linear_model/plot_ols.html,除了我想使用自己的数据。我想知道如何将csv变成python数据集,如果可能的话。
答案 0 :(得分:0)
在您的情况下,sales是您可能正在寻找的DataFrame。您可以操作它,例如尝试打印sales.columns。
答案 1 :(得分:0)
基本上,销售已经是数据集。您正在尝试传递dataframe对象来代替文件名。因此,您可以直接将销售用作数据集,因为它将包含要素和标签或
dataset = np.loadtxt('sales.csv', delimiter=",")
如果你有正确的数据格式,这两种方法都可以。