lucene.net/examine weight html标签

时间:2013-07-10 09:32:15

标签: c# umbraco lucene.net examine

我们正在实施这个项目,我们正在实施Examine / Lucene.net。我会寻求你们的一些指导。

据我所知,谷歌的知识是,如果我想增加体重,我需要增加场上的重量,对吗?

但我可以得到这样的结果:如果该术语在h1标签内或该标题中,它是否能够提升一个术语。提供完整的site-html,并进行频繁的术语搜索。

我想做的事情是,没有提供获取html文档的服务,并且从中可以找到该文档中的哪些单词根据文本中使用的术语进行优化,如果它们是在重要的地方,如标题标签或h2标签等前进。

这有可能实现吗?所以编辑们的生活可以知道,"他们写的是最好的搜索词。

提前非常感谢。

1 个答案:

答案 0 :(得分:1)

我认为这不是那么有效。是的,你可以增加一个字段,但你不能在一些标记中增加一个依赖于它的位置的术语,因为你在搜索时不知道它。

我认为你可以做的是创建一个Umbraco事件处理程序,在页面发布时触发。这个事件可以:

  1. 利用索引的GatheringNodeData事件
  2. 获取基于富文本编辑器的字段的内容,并使用正则表达式或类似HtmlUtility的内容根据其标记位置提取特定文本,例如H1,H2和H3文本。

  3. 对于找到的标题中的每段文字,将其添加到字符串变量中

  4. 将整个字符串添加到Lucene索引中作为新字段,例如“标题”
  5. 现在,您可以将“标题”字段分别提升到包含包含HTML的字段的字段。