基于语义的代码搜索

时间:2017-04-04 07:38:41

标签: search semantics code-search-engine code-search

我们有大量的存储库。我们希望在这些存储库上实现基于语义(功能)的代码搜索。现在,我们已经实现了基于关键字的代码搜索,我们在其中搜索了所有存储库文件并使用elasticsearch对它们编制索引。但这并没有解决我们的问题,因为一些存储库的评论和记录很差,因此搜索特定的代码/库变得困难。

所以我的问题是:是否有任何开源库或此字段中的任何先前工作可以帮助我们索引存储库文件的语义,以便搜索代码变得容易,这将也帮助我们重新使用代码。我找到了一些研究论文,如Semantic code browsingSemantics-based code search等,但没有用,因为没有给出实际的实现。那么请你建议一些好的图书馆或项目来帮助我实现同样的目标。

P.S: - 此外,像Koders,Google,cocycles.com等公司开始基于功能进行代码搜索。但他们中的大多数人都在没有提供任何适当反馈的情况下关闭了他们的运营,有谁能告诉我他们面临的困难。

2 个答案:

答案 0 :(得分:0)

不确定这是否是您正在寻找的内容,但我写了https://github.com/google/zoekt,它使用基于ctags的代码理解来提高排名。

答案 1 :(得分:0)

查看insight.io

它提供语义搜索和浏览 enter image description here

enter image description here