预测活跃成员变得无效的可能性?

时间:2016-12-07 06:09:21

标签: azure machine-learning azure-machine-learning-studio

我有一个成员数据库,有些是活动的,有些是非活动的。

我想预测活跃成员变得无效的可能性?

我应该在非活动成员上运行AML(不拆分),当我发布模型时,我会传递活跃成员吗?

之前我尝试了很多AML数据集但是通常你会有一个包含你想要预测的值的列(Active-Inactive)(True-False)(Red-Black-White)但我从未尝试过只有一个值使用。转换你的模型。

1 个答案:

答案 0 :(得分:0)

您需要使用活动和非活动成员训练您的模型。我会拆分您的数据集,以便在您的培训和测试集中都有活动和非活动成员的示例。

让我们讨论分割数据的原因。请记住,通过有监督的学习,您需要带有标记示例的数据。例如,假设我想根据平方英尺和邮政编码预测房屋的成本。为了训练我的模型,我需要一个现有房屋的数据集,其面积,邮政编码和价格如下:

SquareFootage ZipCode价格
2000 48075 200,000
3000 48075 300,000
4000 48075 400,000
5000 48075 500,000

在这个例子中,平方英尺和邮政编码是我的特征(影响你想要预测的东西的东西),价格是我的标签(你想要预测的东西)。我可以在上面的一些数据上训练模型,然后使用训练的模型来预测价格,只给出一个平方英尺和邮政编码。

因此,我分割数据的原因是提供大部分数据来训练模型(它将处理数据以找出“训练模型”模块中的特征和标签之间的相关性),但我们想要阻止一些标记数据来测试我们构建的模型。然后,我们可以将训练模型生成的价格值与测试数据集中的实际标记价格值(在“评分模型”模块中)进行比较,以查看模型的执行情况。 (我们不能对两者使用相同的数据......模型是使用训练数据构建的,因此它将非常准确地执行;我们阻止未使用的数据进行测试。)

因此,对于您的示例,我会尝试随机拆分,因此有活动和非活动成员的示例(即您的标签 - 非活动或活动),您还需要提供影响活动的相关功能。