所以,我将推文标记为转发或未转发,我必须使用逻辑回归来构建模型,以预测推文是否会被转发。
我面临的问题是我不知道如何使用多个特征与逻辑回归。我必须使用的功能是tf-idf,lda,是否转发了推文,过去转发过某个用户的推文的次数。
如何在二进制分类中使用4个功能?任何帮助将不胜感激。
答案 0 :(得分:1)
这是使用clasiffier默认参数的一个例子,想法是如果你有两个,或者如果你有更多的功能,则使用相同的程序:
dataset = np.ndarray(shape=(num_rows,3),dtype=np.float32) ;
retweeted_output = np.ndarray(shape=(num_rows,1),dtype=np.float32)
#perform some actions to fill your data structures
model = LogisticRegression();
model.fit(dataset,retweeted_output);