NLP算法原理

时间:2012-01-08 20:00:02

标签: algorithm nlp web genetic-algorithm

我是这个非常有用的Q& A网站的新手,我的英语不是很好,很抱歉。

我对一个我认为不难做的网络项目感兴趣,这是一个简化的冲浪。

Algorithm description 1
Algorithm description 2

该算法确保孩子非常简单,因为它可以快速分析网页内容并查找相关信息。

有人能告诉我这个算法是如何运作的,我试图做出类似的东西吗?

这个算法的基本原理是什么?

谢谢!

2 个答案:

答案 0 :(得分:1)

我刚回答非常相似question。在您的特定情况下,手动创建主题列表是有意义的,在某些示例中使用机器学习进行训练,然后在搜索期间对每个搜索结果进行分类主题之一。因此,您将获得按主题分组的搜索结果。

UPD。好的,这是一步一步指导的一种可能方式。

首先,看一下我最近关于文档相似度计算的post。然后执行以下操作:

  1. 实施计算2个文本之间相似性的程序(如我的帖子所述)或找到类似的东西。
  2. 创建多个文档集合,每个类别(主题)对应一个(食品,IT,政治,医药等)。
  3. 计算每个集合中所有文档的公共向量。
  4. 当用户执行搜索时,为您找到的每个结果计算向量。
  5. 将每个结果分类到具有最相似的公共向量的类别。
  6. 按计算类别分组结果。

答案 1 :(得分:-1)

对我来说,NLP是一个查看原始文本并对其进行标记的程序。

我这样看是因为我希望像一个培训师(自我监督)一样,只要你记录用户在马尔可夫链中对它说的内容,就可以使用gurnts成为单词,这样你就可以使用了尽可能多的处理器能力来加速变异。

请注意,我还没有这样做,但我认为这个想法很酷,很黑客,而且看起来很有效。