我想展示如何在表或DataFrame中进行预测。
我试图将X_test,y_test和预测(predictions = model.predict(X_test))放入一个DataFrame中,以显示所有评论都是正面的或负面的预测。
import pandas as pd
predictions = model.predict(X_test)
df_prediction = pd.DataFrame({
'X_test': [X_test],
'y_test': [y_test],
'prediction': [predictions]
})
df_prediction.head()
变量“ X_test”(名称:评论,长度:4095,dtype:对象)看起来像:
15806 [“轮胎”,“量规”,“种类”,“东西”,“制造”,“ ...
541 ['like','said','title','review','say','pr ...
...
变量“ y_test”(名称:标签,长度:4095,dtype:对象)看起来像:
15806正值
541正值
...
可变的“预测”如下:
array(['positiv','positiv','positiv',...,'positiv','positiv', 'positiv'],dtype = object)
目前,我在第一行中获得了一个包含所有数据的DataFrame,但我需要作为一个包含所有行的表。
答案 0 :(得分:0)
如果x_test
,y_test
和predictions
是列表,那么您可以这样做:
df_prediction = pd.DataFrame({
'X_test': x_test,
'y_test': y_test,
'prediction': predictions
})
此外,df_prediction.head()
将打印数据帧的前5行。您可以使用print(df_prediction)
或仅使用df_prediction
(对于Jupyter Notebook中的格式化输出)来查看整个数据。