将给定的Porter stemmer集成在C中

时间:2011-10-22 17:31:43

标签: c algorithm porter-stemmer

我看到以下内容有一个用于C http://tartarus.org/martin/PorterStemmer/

的porter stemmer实现

然而,虽然我已多次尝试过,但我无法将其集成到我的代码中。有人可以告诉我应该如何调用下载的文件以及我应该传递给它以阻止字符串。

换句话说,我有一个需要阻止字符串的程序,我需要一个porter stemmer。我正在考虑使用上面但我不知道如何使用下载的文件。请举例

2 个答案:

答案 0 :(得分:2)

c代码提供功能:

int stem ( *str, int i, int j);

那是你应该打电话的那个。它修改了原始字符串,并返回结果的长度。典型用法在函数stem_file()中演示,它的作用如下:

char buff[12345]; //should contain one word.

buff [ stem(buff, xx, yy) ] = '\0' ;

我不知道第2和第3个参数究竟是什么意思。查一查。

答案 1 :(得分:1)

代码分为两部分。

有一个部分标志着Stemmer定义的结束。在此之前,他们已经展示了搬运工算法所述的主要5个步骤。 之后的部分处理文件处理部分,将字符转换为小写。 stem函数处理初始化部分。 j被认为是初始字长。

正确完成一次。这不是很容易理解。