sklearn.preprocessing中LabelEncoder的类似方法?

时间:2018-01-26 10:06:53

标签: tensorflow machine-learning scikit-learn data-science

对于sex等分类数据的编码,我们通常在LabelEncorder()中使用scikit learn。但是,如果我要使用Tensorflow而不是Scikit Learn,那么执行此类任务的等效功能或方法是什么?我知道我们可以使用one hot encoding轻松tensorflow,但它会创建标签为1001而不是10

1 个答案:

答案 0 :(得分:0)

TensorFlow中有一个名为tf.feature_columns的包,其中包含4种从输入数据创建分类列的方法:

  • categorical_column_with_hash_bucket(...):将输入值哈希到固定数量的类别
  • categorical_column_with_identity(...):如果您有数字输入,并且您希望将值本身视为分类列
  • categorical_column_with_vocabulary_list(...):根据固定(记忆)单词列表输出类别
  • categorical_column_with_vocabulary_file(...):与_list相同,但从文件中读取词汇

该软件包还提供了更多将输入数据输入模型的方法。有关概述,请参阅该程序包开发人员编写的blogpost