标签: c# ms-office
我正在寻找一种从任何ms office文档(word,excel或powerpoint)读取原始文本的有效方法,然后显示不同的单词列表以及该单词使用次数的计数。如果可能的话,我希望能够排除常用词('和','到',''等'。
我能用C#实现这一目标的最佳方式是什么?
答案 0 :(得分:1)
你应该研究Lucene.NET - 它能够从各种来源构建单词索引 - 包括我相信的单词文档。