我收到了ValueError:解压错误的值太多了。这是代码示例
import numpy as np
import pandas as pd
from textblob.classifiers import NaiveBayesClassifier
sms_raw = pd.read_csv('text.csv')
# training dataset 70%
# test dataset 30 %
sms_raw['split'] = np.random.randn(sms_raw.shape[0], 1)
fltr = np.random.rand(len(sms_raw)) <= 0.7
train = sms_raw[fltr]
test = sms_raw[~fltr]
cl = NaiveBayesClassifier(sms_raw)
答案 0 :(得分:1)
NaiveBayesClassifier不能将pandas数据帧用作输入。另外,在你的最后一行中你将sms_raw数据作为输入,我猜你的意思是:
cl = NaiveBayesClassifier(train)
您需要直接读取csv文件或将pandas数据帧转换为列表。
尝试使用
train.to_dict(orient='records')
cl = NaiveBayesClassifier(train)
如果你想直接阅读csv,请看这个例子: vectors