如何使用特定文件挖掘Github的项目?

时间:2016-10-15 15:38:14

标签: api github

我正在从Github对Java项目进行实证研究,我写了Python script来搜索使用搜索API的项目。

然而,我真正希望包含在我的搜索条件中(至少有100颗星的Java项目)只能获取Maven项目(仅考虑根目录中带有pom.xml的项目。)

那么,我如何才能在Github上搜索项目,只考虑使用Maven的项目(例如在根目录中有一个“pom.xml”)?这有可能吗?

因为Github API将结果限制在前1000个条目中,所以我不能只跳过ant和gradle项目。

我一直在搜索Github API文档,但没找到我要找的东西。如果我找到解决方案,我会记得在这里发布:)

提前致谢!

2 个答案:

答案 0 :(得分:3)

您可以使用此GitHub search查询:

maven in:name,description stars:>=100

它将返回所有包含 maven 字样的回购词,其名称或说明中加上 100 次或更多次。

答案 1 :(得分:0)

试试这个:https://github.com/search?l=Maven+POM&q=extension%3A.xml+project&ref=searchresults&type=Code&utf8=

基本上,搜索扩展名为.xml的所有文件,其中包含超级公共关键字,如“项目”,然后点击边栏,在语言下,Maven POM。