Question

我有一个包含2列

的CSV文件

actual,predicted
1,0
1,0
1,1
0,1
.,.
.,.

如何阅读此文件并在Python中绘制混淆矩阵？我尝试了一个程序中的以下代码。

import pandas as pd
from sklearn.metrics import confusion_matrix
import numpy

CSVFILE='./mappings.csv'
test_df=pd.read_csv[CSVFILE]

actualValue=test_df['actual']
predictedValue=test_df['predicted']

actualValue=actualValue.values
predictedValue=predictedValue.values

cmt=confusion_matrix(actualValue,predictedValue)
print cmt

但它给了我这个错误。

Traceback (most recent call last):
  File "confusionMatrixCSV.py", line 7, in <module>
    test_df=pd.read_csv[CSVFILE]
TypeError: 'function' object has no attribute '__getitem__'

Answer 1

pd.read_csv是一个功能。您可以使用括号在Python中调用函数。

您应该使用pd.read_csv(CSVFILE)代替pd.read_csv[CSVFILE]。

Answer 2

import pandas as pd
from sklearn.metrics import confusion_matrix
import numpy as np

CSVFILE = './mappings.csv'
test_df = pd.read_csv(CSVFILE)

actualValue = test_df['actual']
predictedValue = test_df['predicted']

actualValue = actualValue.values.argmax(axis=1)
predictedValue  =predictedValue.values.argmax(axis=1)

cmt = confusion_matrix(actualValue, predictedValue)
print cmt

Answer 3

这是一种简单的解决方案，用于以问题中提到的格式计算输入的准确性并绘制混淆矩阵。

from sklearn.metrics import confusion_matrix
from sklearn.metrics import accuracy_score

file=open("results.txt","r")

result=[]
actual=[]

i = 0

for line in file:
    i+=1
    sent=line.split("\t")
    sent[0]=int(sent[0])
    sent[1]=int(sent[1])
    result.append(sent[1])
    actual.append(sent[0])

cnf_mat=confusion_matrix(actual,result)
print cnf_mat

print('Test Accuracy:', accuracy_score(actual,result))

如何在python中读取csv文件并绘制混淆矩阵

3 个答案: