应用错误收集

Google预测API - 用于多分类的训练数据语法

时间：2015-09-20 08:00:54

标签： web bigdata classification training-data google-prediction

尝试利用Google Prediction API的强大功能对我的数据进行分类。我的数据库中的每个项目都可以分配多个类别。

例如： #include <stdio.h> void rDigitPos2(int num, int digit, int *pos); int main() { int number; int digit, result = 0; printf("Enter a number: "); scanf("%d", &number); printf("Enter the digit: "); scanf("%d", &digit); rDigitPos2(number, digit, &result); printf("rDigitPos2(): %d", result); return 0; } void rDigitPos2(int num, int digit, int *pos) { static int count = 0; if (num % 10 != digit) { count++; //increment of position rDigitPos2(num/10, digit, &pos); *pos = count;//returns the position of the digit } 可以分配 "My Nexus phone is rebooting constantly" 和 #Android 标记。< / p>

我想将我的培训数据上传到Google，但我不确定如何将这两个标记应用于相同的内容。在以下 example 中，我发现了为每个内容提供一个类别的语法，如下所示：

#troubleshooting ， "Android"

多分类培训数据的正确语法是什么？

2 个答案:

答案 0 :(得分：0)

除非我误解了你的问题，否则我认为答案就在文档here中。

即，关于文本字符串的部分解释了当您提交文本字符串时，系统实际上将其切割为多个字符串，使用空格作为分隔符分隔所有内容。他们指出“Godzilla vs Mothra”是“哥斯拉”，“vs”和“Mothra”。所以在你的情况下，你可以使用“Android故障排除”。系统会在“Android”和“疑难解答”中将其分开。

答案 1 :(得分：0)

来自文档：

每行只能 one label assigned ，但您可以通过 repeating an example and applying different labels to each one 将多个标签应用于一个示例。例如：

“兴奋”，“天啊！刚过一个神话般的日子！”

“烦人”，“天啊！刚刚度过了美好的一天！”

如果你向这个模型发送推文，你可能会得到这样的分类：“兴奋”：0.6，“烦人”：0.2。