标签: tensorflow autoencoder
我有用户项评级元组。用户和项目当前都是字符串(哈希码或纯文本字符串,思想书或电影标题)。评级是整数。我正在试图找出将这些评级纳入TF以构建自动编码器所需的数据转换。
假设我有100K可能的项目。我的想法是我应该提供模型稀疏张量,其中每个小批量将是一组用户项目评级。我需要将项字符串转换为整数id才能执行此操作吗?除此之外,我还应该知道其他任何细节吗?