应用错误收集

时间：2015-01-22 19:46:40

标签： machine-learning training-data

我想收集用户信息以确定他们是男性还是女性。我的用户没有标记数据，但我知道一些可以轻松预测性别的功能。一个例子是由用户创建的文本，其中包含与一个性别密切相关的单词（例如：男性：啤酒，足球比赛，拳击手。女性：面部，化妆，文胸）。

答案 0 :(得分：1)

既不受监督也不受监督。您只是应用了一些预定义的规则来对男性/成名进行分类。

这也不是机器学习，因为你没有使用任何学习方法......

答案 1 :(得分：0)

有监督的学习方法将使用用户使用的所有文本，并允许机器通过尝试猜测用户的性别然后使用标签进行自我纠正来确定哪些单词很重要以及重要程度。

无监督的方法是为用户提供机器的所有文本，并允许它尝试从中创建不同的模式组。然而，除了“男性”和“女性”之外，还有很多方法可以对用户进行分组，因此这不是一个理想的无监督问题。

告诉系统哪些单词很重要，并将系统分成几组，而这只是一个常规的程序，可以通过任何可以匹配文本并提供输出的编程语言来完成。 / p>

亲·克

名词   1。   计划的一系列未来事件，项目或表演。