用于优化参数的机器学习

时间:2017-01-31 12:42:44

标签: python machine-learning statistics

对于我的硕士论文,我使用第三方程序(SExtractor)以及python管道来处理天文图像数据。 SExtractor采用包含大量参数的配置文件作为输入,这会影响(在一些中间步骤之后)我的数据的统计信息。我已经花了太多时间玩这些参数,所以我对机器学习有点了解,并且已经获得了非常基本的了解。

我现在想知道的是:当判断参数的性能或质量的唯一方法是使用分析运行的最终统计时,使用机器学习算法来优化SExtractor的参数是否合理(在我的机器上至少需要一个小时)并且有超过6个参数会影响统计数据。

作为一个例子,我已经包含了我所指的2个不同版本的统计数据,这些版本的Sextractor参数略有不同。左图中的红线是标准偏差的中值(应该是)。蓝线是我得到它们时标准差的中位数。右图显示2个数据集中对象的差异。

我知道这是一个非常具体的问题,但由于我是机器学习的新手,我无法判断这是否可行。所以,如果有人可以建议我,如果这是一个毫无意义的努力,并指出我是正确的,那将是很好的。  Example 2 Example 1

1 个答案:

答案 0 :(得分:0)

您可以根据已有的数据尝试有根据的猜测。您正在尝试优化参数,使标准差的中位数具有所需的值。您可以假设各种模型,并尝试根据模型和估计数据估计参数。但我认为你应该对机器学习有很好的理解。好的,我的意思是beyound一个本科课程。