在Sklearn中创建训练子集

时间:2017-05-05 11:06:43

标签: python numpy scikit-learn

我正在尝试使用load_files中的sklearn加载我的文字数据创建一个训练子集,如下所示:

from sklearn.datasets import load_files
categories = ['cat_1', 'cat_2']
corpus=load_files(container_path='...container_folder', description=None, load_content=True, encoding='utf-8', categories=categories, shuffle=True, decode_error='ignore', random_state=42)
X = corpus.data
y = corpus.target
import numpy as np
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)

这似乎工作正常。然后,我尝试按照http://scikit-learn.org/stable/tutorial/text_analytics/working_with_text_data.html中的工作流程进行操作,但是当我输入第一行时,例如:

print (X_train.target_names)

我收到错误:

  

"属性错误:' list'对象没有属性' target_names'"

对不起,如果这是一个愚蠢的问题,但可以请任何人解释我这有什么问题吗?

0 个答案:

没有答案