对于knn算法,以下代码行的含义是什么?

时间:2014-05-26 05:23:57

标签: python sentiment-analysis knn

我遇到了这段代码,但我不知道以下代码行的功能是什么:

negTrain = neg[:N]
posTrain = pos[:N] 
negTest = neg[N:]
posTest = pos[N:]  

有人可以指导我吗?

2 个答案:

答案 0 :(得分:0)

你需要训练前N个阳性和前N个阴性,这意味着0到N-1的位置。

你从N位置开始测试,直到负面和正面结束。

因为当你说火车时这是KNN,这基本上意味着你将建立一个包含训练数据的表格,并使用距离和训练数据的标签来评估测试数据。 KNN本身没有任何训练。

答案 1 :(得分:0)

在任何机器学习算法中,您都在尝试查找数据的含义分类。它是如何开始的,您首先在训练数据上训练您的算法/机器。从这些代码行判断,您使用KNN算法进行逻辑回归。这是一种二元分类方案,您将属于一个类的内容分类为正面,将另一个类分类为负面

一个例子是逻辑回归机器学习算法,其中阳性表示您患有疾病,而阴性表示您没有疾病。您将获取训练数据并将其分解为正面和负面示例。你知道哪些是正面和负面的。然后,您可以训练学习算法,以便尽可能提高分类准确度。

一旦你完成了,你有另一组数据表示为测试数据,这里也有正面和负面的例子,你看看它是否会在分类中做同样的工作作为您的训练数据。如果您的分类准确性更差,则需要修改算法或参数。如果它更好,那就太棒了。

这四行代码基本上都是以下内容。对于您的阳性和阴性训练样本,您可以从0到N - 1取样。测试阳性和阴性样本取自N直到阵列末尾。

希望这有帮助!