我想编写一个能够在源代码文件中搜索特定模式的程序......换句话说:输入是一段代码,例如:
int fib (int i) {
int pred, result, temp;
pred = 1;
result = 0;
while (i > 0) {
temp = pred + result;
result = pred;
pred = temp;
i = i-1;
}
return(result);
}
输出是包含这段代码或类似代码的文件。
在开源世界中,代码在其他项目中重复使用。特别是库经常被复制到项目中。为了使bug修复更容易,我需要能够知道在哪些项目中使用了特定的库或代码。
因此我想尝试使用apache solr。我不知道这是不是一个好主意(我会对能帮到我的一切感到高兴)
我的计划是索引我的源代码文件...因此我需要一些工具?标记化源代码文件。就像给我所有函数,变量等名称一样。我可以使用输出来提供solr索引。但是我不确定apache solr中是否已经存在tokenizer或dataimporthandler这样做?
答案 0 :(得分:1)
答案 1 :(得分:0)