我目前正在搜索如何识别推文语言。我找到了apache库tika,但它不能很好地工作...... 现在,我找到了langdetect,我正在尝试使用它。 目前,我已经找到了一个代码示例,但我不明白文件是什么"个人资料" ...我不知道我需要放在哪里...
String path = "my path to the file profiles";
DetectorFactory.loadProfile(path);
detector = DetectorFactory.create();
detector.append(tweet);
langDetected = detector.detect();
答案 0 :(得分:0)
在使用此库之前,请先致电
DetectorFactory#loadProfile()
进行初始化。
DetectorFactory.loadProfile(profileDirectory);
此方法的参数是具有语言配置文件的目录。 语言配置文件与此库捆绑在一起,因此请在存储库中将"trunk/profile"
指定为loadProfile()
的参数。
配置文件文件位于profiles
subdirectory