我正在研究英语的文本分类问题。问题解释如下:
我有一个事件数据集,该数据集包含四列-事件名称,事件描述,事件类别,category_id。数据集中大约有32个类别,例如旅行,体育,教育,商务等。我必须根据事件的名称和描述将每个事件分类为一个类别。
这是我到目前为止所做的:
现在我想知道:
1. Should I apply standardization and/or scaling to my data?
2. If yes, then in which step should I apply it?