我正在尝试使用load_files
中的sklearn
加载我的文字数据创建一个训练子集,如下所示:
from sklearn.datasets import load_files
categories = ['cat_1', 'cat_2']
corpus=load_files(container_path='...container_folder', description=None, load_content=True, encoding='utf-8', categories=categories, shuffle=True, decode_error='ignore', random_state=42)
X = corpus.data
y = corpus.target
import numpy as np
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)
这似乎工作正常。然后,我尝试按照http://scikit-learn.org/stable/tutorial/text_analytics/working_with_text_data.html中的工作流程进行操作,但是当我输入第一行时,例如:
print (X_train.target_names)
我收到错误:
"属性错误:' list'对象没有属性' target_names'"
对不起,如果这是一个愚蠢的问题,但可以请任何人解释我这有什么问题吗?