TF-IDF如何处理缺失值?

时间:2018-01-04 04:57:34

标签: python-3.x tf-idf text-classification

我正在研究一个分类问题,我必须根据产品信息(如标题,描述和其他属性)对产品类别进行分类。 它适用于不同类别,但在封闭类别中有偏见,例如移动移动配件

我们说我有一个csv,其中我有以下列:

Title | Retailer_Name | Description | RAM | Processor | Suitable For | Price | Category

现在,如果我有两个类别说移动时尚。对于移动设备,适用于列将为NA,对于时尚RAM,处理器将为NA。

所以,我想知道TF-IDF如何在这些列上工作,以及如果有办法在不同类别的各列上执行TF-IDF,然后合并它们。我找到的文章很少,但没有一篇与我的具体问题相关。

任何相关文章都可以。我只是想了解工作情况,以便我能够实施它。

任何帮助将不胜感激。谢谢..!

0 个答案:

没有答案