如何使用Cloud ML进行单热编码功能?我是否必须在TensorFlow模型中执行此操作,还是可以在Cloud ML SDK本身中执行此操作?
答案 0 :(得分:4)
请注意,您需要更多选择所需的表示形式 - k(或一个热)或稀疏表示。
features.categorical('passenger_count').one_of_k()
旁注,您可能也对数字列感兴趣,并且能够应用日志(通常对计数类型的功能有用)或通过分段进行离散化。
答案 1 :(得分:2)
在预处理(CsvFeatures)中,使用:
features.categorical(' passenger_count&#39)
您还可以传入频率阈值,以避免数据中过于频繁出现的单热编码值。