使用Lucene / swish-e的自定义代码浏览器

时间:2010-07-12 03:41:18

标签: lucene swish

我正在开发一个具有庞大代码库和多个组件的C ++项目。我想为它创建一个丰富的代码浏览器,它将为视觉工作室提供类似的体验。我正在考虑使用Lucene或Swish-e作为后端文本索引器的Adobe AIR应用程序。我从未使用过两者中的任何一个。如果您使用过其中一种或两种,请告诉我Lucene / Swish-e是否适合此类应用?我可以配置它以使其对C ++,Flex等具有语言感知能力吗?是否有针对此问题的现有开源解决方案我可以看看?

1 个答案:

答案 0 :(得分:0)

Lucene in Action第二版。包含一个名为krugle的产品章节,该产品使用Lucene搜索源代码。我从来没有使用过swish-e,所以我无法比较它们,但那本书谈到了使用Lucene的好处和不利之处。你也可以尝试他们的搜索here,这是值得的。

总结他们的章节:

  • 优点:Lucene非常大,非常快。从本质上讲,一旦你拥有了索引,它就是所有的肉汁。
  • 缺点:标准分析器抛出像“if”和“for”这样的单词以及像“{”这样的标点符号,它们在源代码搜索中很重要。代码也不容易标记化(例如“GetDatabaseInstance”应该标记为三个单词,而不是一个单词)。所以他们不得不写很多自己的分析仪。