机器学习 - 确定概率价格

时间:2015-02-15 18:54:26

标签: machine-learning

我有大量关于对象交易的数据。对象使用关键字类别定义。交易也是由关键字类别定义的(但不一样)。对于每个特定对象,我对每种交易条件组合都有大量的原始数据。

假设某个特定对象的 交易价格是此交易发生条件的函数。

例如,如果交易时天气晴朗,买家将能够以30美元的价格出售这个物品,如果下雨则为40美元。

事情变得更复杂,因为我不想要每个特定对象的定价功能。相反,我希望计算机学习一种基于一组对象特征来定义概率价格的方法,一组交易条件。

换句话说,我希望计算机在

中学习f
expected_price = f(characteristics_of_object, conditions_of_transactions).

示例

假设对象可以在这些类别中进行标记:

colors: black, blue, red, green, white
materials: wood, steel, plastic, glass
shapes: circle, square, triangle, oval

这样任何对象都可以通过以下方式组合每个类别的多个标签:

my_foo_object = {
    “color”: [“black”, “blue”],
    “material”: [“wood”],
    “shape”: [“round”, “square”]
}

正如我所说,交易是由他们的条件定义的,例如:

weather: sunny, cloudy, rain
payment: credit_card, cash, check
age_of_buyer: 21, 22, 23, 24……., 55, 56
age_of_seller: 21, 22, 23, 24……., 55, 56
country_code: us, uk, fr, de, jp, nl

特定交易由以下内容定义:

my_foo_transaction = {
    “object”: my_foo_object,
    “weather”: [“cloudy”, “rain”],
    “payment”: “credit_card”,
    “age_of_buyer”: 29,
    “age_of_seller”: 43,
    “country_code”: “us”,
    “price”: 84
}

我最终想要的是能够告诉合理的预期价格,例如:

object_color: red
object_shape: round
weather: sunny
age_of_buyer: 52
(without necessarily having to specify all the variables)
=> price?

随着对置信区间的估计(如果特定查询的间隔很大,我可以判断出指定的条件/特征没有可辨别的模式)。

我知道这听起来不像是琐碎的东西,我显然不是要求一个完整的解决方案(这可能是荒谬的)。

你们有没有经历过类似的问题?您是否对要考虑的事项有任何想法,线索或建议?什么是应用于处理这个问题的最佳范例?

0 个答案:

没有答案