我正在寻找显示如何为文本分类绘制决策边界的示例。我知道sklearn文档中的一些示例,但是如何将它们应用于文本数据?
我甚至不确定,要绘制什么。可以为此绘制决策边界吗?
我正在考虑以某种方式使用CountVectorizer的结果,然后将其转换为np.array。
网上有什么好的例子吗?
答案 0 :(得分:1)
这里的困难在于文本分类是一个高维问题,其中维度等于词汇量的大小。在2d中绘制该图需要首先应用维数减少技术,例如pca或t-sne,然后在该新表示上训练学习算法。即便如此,我怀疑你的情节将如何提供信息。
您可以使用玩具示例,只有2-3个单词可视化分隔类别的线条(2d)或表面(3d),但这将是一个玩具示例。