标签编码和输入分类数据

时间:2017-12-04 11:46:29

标签: python scikit-learn dataset encode categorical-data

我的数据集中包含一些catergorical列。其中一些列中包含由np.nan指示的缺失值。

我想LabelEncode分类数据,后来Impute缺少值。我正在使用sklearn。但是,当我尝试LabelEncode categorical列时,如下所示,' nan'值被视为标签,并被编码为某个值。

for x in cat_cols:
    encoder = LabelEncoder()
    alldata[x] = encoder.fit_transform(alldata[x].astype(str))

我不希望这种情况发生。如何对除categorical以外的nan值进行编码。?

我知道我可以用nan替换Encodenan。但我不想这样做。我想将mode替换为Imputer,以便使用sklearn中的$(document).ready(function() { var hyperLink = $("a"); $.each(hyperLink, function(index, value) { if($(this).hasClass('noclass') || $(this).parents('.noclass').length) { return; } var href = $(value).attr("href"); //Test code to update the back ground $(value).css("background-color", "red"); $(value).attr("href", "/" + countrycode + (href == '/' ? '' : href)); href = $(value).attr("href"); }); }); 进行输入。我怎么能这样做??

0 个答案:

没有答案