我开始使用Tensorflow并阅读the Whitepaper of Wide&Deep Learning for Recommender Systems from Cheng et al.现在我在两个域中有问题,就像在the tutorial中一样使用张量流。
如果我使用tf.contrib.layers.sparse_column_with_hash_bucket("education", hash_bucket_size=1000)
之类的分类列:在其背面使用此功能的模型 One-Hot-Encoding ?或者我可以应用One-hot-Encoding并且这种散列有什么优势而不是One-Hot-Encoding? Hash是什么:我是否必须将hash_bucket_size
设置为与此功能的不同值一样高的值?
第二个问题是关于连续实值特征的规范化。程等人。写道他们的“连续实值特征被归一化为[0,1]”。如果我使用tf.contrib.learn.DNNLinearCombinedClassifier
,这会自动完成吗?或者由我来实现这些规范化?
感谢您的支持!