我正在研究一个分类问题,我必须根据产品信息(如标题,描述和其他属性)对产品类别进行分类。 它适用于不同类别,但在封闭类别中有偏见,例如移动和移动配件。
我们说我有一个csv,其中我有以下列:
Title | Retailer_Name | Description | RAM | Processor | Suitable For | Price | Category
现在,如果我有两个类别说移动和时尚。对于移动设备,适用于列将为NA,对于时尚RAM,处理器将为NA。
所以,我想知道TF-IDF如何在这些列上工作,以及如果有办法在不同类别的各列上执行TF-IDF,然后合并它们。我找到的文章很少,但没有一篇与我的具体问题相关。
任何相关文章都可以。我只是想了解工作情况,以便我能够实施它。
任何帮助将不胜感激。谢谢..!