我应该将哪种机器学习算法用于其logic未知的数据集?

时间:2016-07-09 20:20:44

标签: machine-learning tensorflow

我有一个假设的机器学习问题。理想情况下,我希望得到一个Tensorflow示例的答案。问题是编程语言不可知。

问题示例A:

我的培训材料看起来像这样(我已更改其内容以使问题更清晰)。

培训数据:

[{
    "a": 564356,
    "b": 23463246
}, {
    "a": 723572575,
    "b": 45472
}, {
    "a": 1351345,
    "b": 0943563456
}, {
    "a": 12523635,
    "b": 3249582345
}, etcetera...]

我想提供这样的数据(又名“输入”):

[{
    "a": 232346,
    "b": 373457
}, {
    "a": 36458,
    "b": 5674567
}, etcetera...]

并且返回了这样的数据(又名:“答案”):

[{
    "a": 113424,
    "b": 5674567
}, {
    "a": 15345,
    "b": 5678
}, etcetera...]

问题示例B

我的培训材料看起来像这样(我已更改其内容以使问题更清晰)。

培训数据:

[{
    "q": "What animal do you like",
    "a": "Dog"
}, {
    "q": "What is your favorite color",
    "a": "Blue"
}, {
    "q": "Do you like beer as a drink",
    "a": "Yes"
}, {
    "q": "Do you have a color you like",
    "a": "Green"
}, etcetera...]

我想提供这样的数据(又名“输入”):

[{
    "q": "What color do you like",
    "a": "Yellow"
}, etcetera...]

并且返回了这样的数据(又名:“答案”):

[{
    "q": "What is your favorite color",
    "a": "Yellow"
}, etcetera...]

请注意,我不是试图让算法回答这个问题,而是提供一个逻辑Q和A作为回应。

问题
我应该使用什么训练算法来训练模型来对抗未知逻辑(上面的训练数据),这样当我提供“输入”时,它将返回一个答案(如:“答案”)。

1 个答案:

答案 0 :(得分:0)

不确定张量流支持什么,但通常对于此类问题,您应该使用无监督学习算法。

如果你有很多训练数据,kNN会给你合理的表现。虽然对于你的第二个用例你应该有一个很好的方法来分解问句。我从简单的转换到单词包开始,然后从那里开始。