Question

我正在尝试使用load_files中的sklearn加载我的文字数据创建一个训练子集，如下所示：

from sklearn.datasets import load_files
categories = ['cat_1', 'cat_2']
corpus=load_files(container_path='...container_folder', description=None, load_content=True, encoding='utf-8', categories=categories, shuffle=True, decode_error='ignore', random_state=42)
X = corpus.data
y = corpus.target
import numpy as np
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)

这似乎工作正常。然后，我尝试按照http://scikit-learn.org/stable/tutorial/text_analytics/working_with_text_data.html中的工作流程进行操作，但是当我输入第一行时，例如：

print (X_train.target_names)

我收到错误：

＆＃34;属性错误：＆＃39; list＆＃39;对象没有属性＆＃39; target_names＆＃39;＆＃34;

对不起，如果这是一个愚蠢的问题，但可以请任何人解释我这有什么问题吗？

在Sklearn中创建训练子集

0 个答案: