在为模型配置公平性监视时,即使预测标签是分类的,预测列也只允许使用整数值,这是否是预期功能?如何为分类功能(不是整数)配置此功能?需要手动转换吗?
答案 0 :(得分:0)
培训数据可以具有类别标签,例如“拒绝贷款”,“已授予贷款”。 WML计分终点返回的预测值具有“ 0.0”,“ 1.0”等值,计分终点还具有一个可选列,其中包含预测的文本表示形式,例如,如果prediction = 1.0,则precisionLabel列可能具有“ Loan Granted”值。如果有此列,则在为模型配置有利和不利结果时,可以指定字符串值“ Loan Granted”和“ Loan Denied”。可用,则需要为有利/不利类指定整数/双精度值1.0、0.0。
WML具有输出架构的概念,该概念定义了WML计分终点的输出架构以及不同列的角色。这些角色用于识别哪一列包含预测值,哪一列包含预测概率以及类标签值等。自动为使用模型构建器创建的模型设置输出模式。也可以使用WML python客户端进行设置。用户可以使用输出模式来定义包含预测的字符串表示形式的列。这是通过将列的modelling_role设置为“已解码目标”来完成的。有关WML python客户端的文档,请访问:http://wml-api-pyclient-dev.mybluemix.net/#repository。搜索“ OUTPUT_DATA_SCHEMA”以了解输出架构,要使用的API是store_model API,该API接受OUTPUT_DATA_SCHEMA作为参数。