梯度提升-基于月份的价格预测

时间:2018-11-18 17:56:57

标签: python gradient xgboost

我要实现的目标。

我想根据以下所有合同月份数据集中的其他参数,在“天然气未完成”栏下预测天然气价格。我正在使用XG Boosting算法,并且在输出处以某种方式只能看到预测的25个值,并且无法解释它们将应用于哪个合约月份。我使用KFold验证是出于安全考虑,而不是train_test_split

df['Description'].str.contains('ACC')

代码。

  Contracts     NG Open  NGHigh  NGLow   NGLast    NGVolumes   

  2018-12-01    3.907   4.384   3.907   4.272       0 
  2019-01-01    3.917   4.408   3.917   4.291       264295  
  2019-02-01    3.800   4.267   3.785   4.148       155303          
  2019-03-01    3.515   4.007   3.496   3.865       51299       
  2019-04-01    2.735   2.829   2.704   2.793       73226           
  2019-05-01    2.632   2.691   2.602   2.667       54540       
  2019-06-01    2.638   2.719   2.634   2.692       34269   

代码输出

准确性:99.16%(1.51%)

[2.90288328 2.48242494 2.63815259 2.56852281 2.56852281 2.74960132  2.58107653 2.80135512 2.67153137 3.54629023 2.50640456 2.5038906  3.05384458 2.55023831 2.85925744 2.73849325 2.74080839 2.79646487  2.89086965 2.52839402 2.63251226 2.85012468 2.87403014 2.52685035  2.73180843]

如何将2.9028838,2.48242494 ..的输出与合同月份和第二个月相关联,依此类推,这是我的第一个问题,第二个问题是如何为所有行生成相同的输出。到2027年3月1日,总行数为100,合同月份为

谢谢。

0 个答案:

没有答案