应用错误收集

组合词干和停用标准误字的后果

时间：2019-03-07 15:58:24

标签： text-mining stop-words stemming estimation

我读过Greene，Ceron，Schumacher和Fazekas的一篇文章，名为“自动文本分析的基本要素：比较四个国家的不同文档预处理技术”。

在本文中，作者指出，分别使用词干和停用词删除功能可减少缩放比例估计的标准误差（与未预处理的文本相比）。但是当使用它们的组合时，它会增加。

所以您能帮我为什么分别使用这些技术可以提高精度，同时结合使用S.E.。往上走。

预先感谢， J

0 个答案:

没有答案