找到乳腺癌数据集的类分布 - python

时间:2018-02-14 06:25:47

标签: python scikit-learn

作为python(作业1问题2)中应用机器学习课程分配的一部分,我必须找到乳腺癌数据集(sklearn.dataset)的类分布。我使用的代码如下。函数answer_one将数据集转换为569x30的数据框(569个实例和30个特征)。代码给出了一个错误,指出AttributeError: 'tuple' object has no attribute 'target'。有人可以帮忙吗?

代码是

def answer_two():
    cancerdf = answer_one()
    counts = cancerdf.target.value_counts(ascending=True)
    counts.index = "malignant benign".split()
    return counts
answer_two()

2 个答案:

答案 0 :(得分:0)

错误提及'tuple' object has no...。但它应该是一个数据帧。这意味着您的answer_one()函数不会返回数据帧而是返回元组。查看type的{​​{1}}。如果它说cancerdf是一个元组,那么你需要检查那个部分。

答案 1 :(得分:0)

def answer_two():

    cancerdf = answer_one()
    counts = cancerdf.target.value_counts(ascending = True)
    target = pd.Series(counts)
    target.index=['malignant', 'benign']

    return target


answer_two()

“这将返回一系列索引= ['恶性','良性']”