使用csv数据集训练NaiveBayesClassifier时出错

时间:2017-09-26 06:57:14

标签: python pandas naivebayes textblob

我收到了ValueError:解压错误的值太多了。这是代码示例

import numpy as np
import pandas as pd
from textblob.classifiers import NaiveBayesClassifier

sms_raw = pd.read_csv('text.csv')
# training dataset 70%
# test dataset 30 %
sms_raw['split'] = np.random.randn(sms_raw.shape[0], 1)
fltr = np.random.rand(len(sms_raw)) <= 0.7
train = sms_raw[fltr]
test = sms_raw[~fltr]
cl = NaiveBayesClassifier(sms_raw)

1 个答案:

答案 0 :(得分:1)

NaiveBayesClassifier不能将pandas数据帧用作输入。另外,在你的最后一行中你将sms_raw数据作为输入,我猜你的意思是:

cl = NaiveBayesClassifier(train)

您需要直接读取csv文件或将pandas数据帧转换为列表。

尝试使用

train.to_dict(orient='records')
cl = NaiveBayesClassifier(train)

如果你想直接阅读csv,请看这个例子: vectors