使用C#从ms office文档中获取不同的单词列表和计数

时间:2009-07-13 14:29:22

标签: c# ms-office

我正在寻找一种从任何ms office文档(word,excel或powerpoint)读取原始文本的有效方法,然后显示不同的单词列表以及该单词使用次数的计数。如果可能的话,我希望能够排除常用词('和','到',''等'。

我能用C#实现这一目标的最佳方式是什么?

1 个答案:

答案 0 :(得分:1)

你应该研究Lucene.NET - 它能够从各种来源构建单词索引 - 包括我相信的单词文档。