我有一个包含以下列/属性的数据集:
Date,Month_Number,Agent_Id,Group_Id,Ticket_Count
Where" Month_Number"是从2014年1月(0)到2016年12月(35)的每个月分配的整数。
" AGENT_ID"是识别代理人/解决问题的人的唯一ID
"分组ID"是标识代理所属的组的唯一ID
" Ticket_Count"是代理商解决的门票/问题的数量
<style>
table, th, td {
border: 1px solid black;
}
th {
text-align: center;
}
</style>
<table style="width:100%">
<tr>
<th>Date</th>
<th>Month_Number</th>
<th>Agent_Id</th>
<th>Group_Id</th>
<th>Ticket_Count</th>
</tr>
<tr>
<td>2014-01-10</td>
<td>0</td>
<td>101</td>
<td>1001</td>
<td>6</td>
</tr>
<tr>
<td>2014-03-15</td>
<td>2</td>
<td>111</td>
<td>1201</td>
<td>10</td>
</tr>
</table>
&#13;
在此示例2行示例中,座席101已于2014-01-10解决了6张门票,而座席111已于2014年3月15日解决了10张门票。
对于 Agent_Id和Group_Id
的给定组合,我必须使用2017年1月的 Ticket_Count 数据进行预测现在,我可以为&#34; Ticket_Count&#34;使用Holt-Winters指数平滑或ARIMA模型制作时间序列。
如何在时间序列模型中进行组合(Agent_Id和Group_Id),以便我可以对相应的&#34; Ticket_Count&#34;
进行预测在我拥有的测试集中,并非训练集中存在Agent_Id和Group_Id的所有组合。此外,并非所有组合都会产生从2014年1月到2016年12月连续的时间序列。
代理商总数= 18000 小组总数= 65
任何帮助将不胜感激!
谢谢!