我正在尝试使用训练数据集来预测测试数据的情绪,但出现错误,ValueError:无法将字符串转换为float:由于我的Text是一个句子。如何使代码正常工作?
import pandas as pd
from sklearn.svm import LinearSVC
train = pd.read_csv('training500.csv')
test = pd.read_csv('test.csv')
desired_factors = ['Text']
model = LinearSVC()
train_data = train[desired_factors]
test_data = test[desired_factors]
target = train.Sentiment
错误出现在这里!
model.fit(train_data, target)
model.predict(test_data.head())
答案 0 :(得分:1)
将文本转换为浮点数的方法是使用float
函数。如果您需要为浮点型的值是变量train_data
,则可以将其写为:
train_data = float(train[desired_factors])
我应该提一下,这仅在您要转换的文本已经是数字(例如float("4.5")
返回4.5
)时有效