我有大量关于对象交易的数据。对象使用关键字类别定义。交易也是由关键字类别定义的(但不一样)。对于每个特定对象,我对每种交易条件组合都有大量的原始数据。
假设某个特定对象的 ,交易价格是此交易发生条件的函数。
例如,如果交易时天气晴朗,买家将能够以30美元的价格出售这个物品,如果下雨则为40美元。
事情变得更复杂,因为我不想要每个特定对象的定价功能。相反,我希望计算机学习一种基于一组对象特征来定义概率价格的方法,和一组交易条件。
换句话说,我希望计算机在
中学习f
expected_price = f(characteristics_of_object, conditions_of_transactions).
示例
假设对象可以在这些类别中进行标记:
colors: black, blue, red, green, white
materials: wood, steel, plastic, glass
shapes: circle, square, triangle, oval
这样任何对象都可以通过以下方式组合每个类别的多个标签:
my_foo_object = {
“color”: [“black”, “blue”],
“material”: [“wood”],
“shape”: [“round”, “square”]
}
正如我所说,交易是由他们的条件定义的,例如:
weather: sunny, cloudy, rain
payment: credit_card, cash, check
age_of_buyer: 21, 22, 23, 24……., 55, 56
age_of_seller: 21, 22, 23, 24……., 55, 56
country_code: us, uk, fr, de, jp, nl
特定交易由以下内容定义:
my_foo_transaction = {
“object”: my_foo_object,
“weather”: [“cloudy”, “rain”],
“payment”: “credit_card”,
“age_of_buyer”: 29,
“age_of_seller”: 43,
“country_code”: “us”,
“price”: 84
}
我最终想要的是能够告诉合理的预期价格,例如:
object_color: red
object_shape: round
weather: sunny
age_of_buyer: 52
(without necessarily having to specify all the variables)
=> price?
随着对置信区间的估计(如果特定查询的间隔很大,我可以判断出指定的条件/特征没有可辨别的模式)。
我知道这听起来不像是琐碎的东西,我显然不是要求一个完整的解决方案(这可能是荒谬的)。
你们有没有经历过类似的问题?您是否对要考虑的事项有任何想法,线索或建议?什么是应用于处理这个问题的最佳范例?