假设您有以下数据集,其中观察到两个变量Color和Size:
Color | Size ------+------ Red | Big White | Small Red | Small Red | Big White | Big Red | Big
要求您了解下面显示的贝叶斯网络的最大似然参数:
Color -> Size
您可以获得表格中描述的学习问题的更多数据,但新数据集包含缺失值。您现在可以使用哪种算法来学习最大似然参数?
答案 0 :(得分:4)
如果您丢弃缺少值的案例,则会得到不准确的值。
因此,您需要对概率进行预测,并且可以使用期望最大化算法。 http://en.wikipedia.org/wiki/Expectation%E2%80%93maximization_algorithm