我遇到了这段代码,但我不知道以下代码行的功能是什么:
negTrain = neg[:N]
posTrain = pos[:N]
negTest = neg[N:]
posTest = pos[N:]
有人可以指导我吗?
答案 0 :(得分:0)
你需要训练前N个阳性和前N个阴性,这意味着0到N-1的位置。
你从N位置开始测试,直到负面和正面结束。
因为当你说火车时这是KNN,这基本上意味着你将建立一个包含训练数据的表格,并使用距离和训练数据的标签来评估测试数据。 KNN本身没有任何训练。
答案 1 :(得分:0)
在任何机器学习算法中,您都在尝试查找数据的含义或分类。它是如何开始的,您首先在训练数据上训练您的算法/机器。从这些代码行判断,您使用KNN算法进行逻辑回归。这是一种二元分类方案,您将属于一个类的内容分类为正面,将另一个类分类为负面。
一个例子是逻辑回归机器学习算法,其中阳性表示您患有疾病,而阴性表示您没有疾病。您将获取训练数据并将其分解为正面和负面示例。你知道哪些是正面和负面的。然后,您可以训练学习算法,以便尽可能提高分类准确度。
一旦你完成了,你有另一组数据表示为测试数据,这里也有正面和负面的例子,你看看它是否会在分类中做同样的工作作为您的训练数据。如果您的分类准确性更差,则需要修改算法或参数。如果它更好,那就太棒了。
这四行代码基本上都是以下内容。对于您的阳性和阴性训练样本,您可以从0到N
- 1取样。测试阳性和阴性样本取自N
直到阵列末尾。
希望这有帮助!