有人可以帮助我满足以下要求吗?
我想建立一个模型,该模型应能理解一段代码并根据代码内容预测编程语言。
任何线索都将受到高度赞赏。
例如:
private int input = 0;
public int getter() {
return input;
}
public void setter(int in) {
input = in;
}
输出-Java
谢谢
答案 0 :(得分:0)
也许使用一些预训练的语言模型来运行测试数据。测试数据可以是一些语句及其所属的语言,您可以按照分类任务进行操作。
答案 1 :(得分:0)
您可以使用N-gram来了解哪个关键字属于哪种语言。您可以签出:ngram resource
您可以通过GitHub上的网页抓取来找到源代码。因此,您可以自己创建源代码和编程语言数据集。如果您想更深入一点,则有一些有关此主题的书籍。 programming language detection book