应用错误收集

我有用户项评级元组。用户和项目当前都是字符串（哈希码或纯文本字符串，思想书或电影标题）。评级是整数。我正在试图找出将这些评级纳入TF以构建自动编码器所需的数据转换。

假设我有100K可能的项目。我的想法是我应该提供模型稀疏张量，其中每个小批量将是一组用户项目评级。我需要将项字符串转换为整数id才能执行此操作吗？除此之外，我还应该知道其他任何细节吗？