数据集是给定年份和月份某个位置上特定昆虫的发生。这可以使用大约30年。现在,当我给出一个随机位置以及未来的年月时,我想根据历史数据在那个位置发现昆虫的概率是多少。
我试图通过将所有可用数据标记为1来对问题进行分类,并希望检查新数据点被标记为1的可能性。但是抛出了错误,因为至少应该培训两个班级。
数据如下:x和y是经度和纬度
x y year month
17.01 22.87 2013 01
42.32. 33.09 2015 12
答案 0 :(得分:1)
以地图的形式考虑问题。您需要针对自己感兴趣的每个时间段绘制一张地图,因此请汇总每个位置在每个月和每年中发生的所有事件。除非位置已被分箱,否则您将需要使用一些分箱,否则将毫无意义。因此,将x和y中的值四舍五入到合理的精度水平,或使用numpy对数据进行装箱。然后,您可以创建带有计数的地图/使用马尔可夫模型预测事件的发生。 您目前无法到达任何地方的原因是,在任何随机点上找到昆虫的机会实际上为0。