我有一个读取文件的python脚本,然后应该检测文件中代码的语言,从https://ghostbin.com/languages.json获取语言ID并将其上传到https://ghostbin.com,语言ID为一个参数。 问题是检测使用的编程语言。我还没有发现任何lib来帮助我。
答案 0 :(得分:0)
大多数代码编辑器使用文件格式来决定该文件中的语言。
除此之外,您可以使用垃圾邮件过滤器中使用的技术。您将代码拆分为单独的单词,然后将这些单词的出现次数与样本进行比较。
答案 1 :(得分:0)
Here is a module使用朴素贝叶斯分类器来执行您想要的操作a corresponding discussion。需要注意的是,模块需要对代码示例进行培训。修改它以保持训练应该很容易。