我想根据推文创建吸烟决策的SVM模型。
根据推文是否有利于吸烟,我将手动标记为“是”,“否”或“不适用”的推文标记为“是”,如果它没有说什么,则将第三个推文标记为“是”。 使用这个作为火车模型,我需要为新推文做出决定,无论是/否/ NA。 我正在使用Scikit Python库。
我查看了示例示例,但我不明白应该为训练模型输入什么,即(X,Y值) 我不明白它是什么意思 "将两个数组作为输入:包含训练样本的大小为[n_samples,n_features]的数组X,以及类标签(字符串或整数)的数组y,size [n_samples]:" 正如它在Scikit tutorial
中所说的那样请有人协助此方案的输入。