Google预测API - 用于多分类的训练数据语法

时间:2015-09-20 08:00:54

标签: web bigdata classification training-data google-prediction

尝试利用Google Prediction API的强大功能对我的数据进行分类。我的数据库中的每个项目都可以分配多个类别。

例如: #include <stdio.h> void rDigitPos2(int num, int digit, int *pos); int main() { int number; int digit, result = 0; printf("Enter a number: "); scanf("%d", &number); printf("Enter the digit: "); scanf("%d", &digit); rDigitPos2(number, digit, &result); printf("rDigitPos2(): %d", result); return 0; } void rDigitPos2(int num, int digit, int *pos) { static int count = 0; if (num % 10 != digit) { count++; //increment of position rDigitPos2(num/10, digit, &pos); *pos = count;//returns the position of the digit } 可以分配 "My Nexus phone is rebooting constantly" #Android 标记。< / p>

我想将我的培训数据上传到Google,但我不确定如何将这两个标记应用于相同的内容。在以下 example 中,我发现了为每个内容提供一个类别的语法,如下所示:

#troubleshooting "Android"

多分类培训数据的正确语法是什么?

2 个答案:

答案 0 :(得分:0)

除非我误解了你的问题,否则我认为答案就在文档here中。

即,关于文本字符串的部分解释了当您提交文本字符串时,系统实际上将其切割为多个字符串,使用空格作为分隔符分隔所有内容。他们指出“Godzilla vs Mothra”是“哥斯拉”,“vs”和“Mothra”。所以在你的情况下,你可以使用“Android故障排除”。系统会在“Android”和“疑难解答”中将其分开。

答案 1 :(得分:0)

来自文档:

每行只能 one label assigned ,但您可以通过 repeating an example and applying different labels to each one 将多个标签应用于一个示例。例如:

“兴奋”,“天啊!刚过一个神话般的日子!”

“烦人”,“天啊!刚刚度过了美好的一天!”

如果你向这个模型发送推文,你可能会得到这样的分类:“兴奋”:0.6,“烦人”:0.2。