需要您的帮助以帮助我解决此问题:
问题陈述-我需要在过去6个月中为电信域创建一个虚拟的数据集。我使用随机数生成日期和时间,并使用以下代码在Pandas中创建。我可以为此数据集在熊猫中生成其他列,但停留在随机的日期和时间上:
test = pd.DataFrame({ 'Date':pd.date_range(start ='2016-09-20',freq ='1h',period = 10000) })
这将创建一个周期数据和时间输入,其精确时差为1小时。显示示例输出:
日期 0 2016-09-20 00:00:00 1 2016-09-20 01:00:00 2 2016-09-20 02:00:00 3 2016-09-20 03:00:00 4 2016-09-20 04:00:00
但是我需要特定的东西来创建数据集:
a)需要更多随机的日期和时间条目作为上午8点至晚上8点之间的时间戳记,因为每个条目代表一个呼叫条目。 b)晚上8点至上午8点之间的时间戳记所需的随机日期和时间条目较少,因为夜间呼叫的人数较少。 c)周末(星期六和星期日)需要较少的随机日期和时间输入
有人可以帮我提供一种方法和解决方案吗?这些条件是在此数据集上执行ML建模所需的条件,而在这些条件下,这个笨拙的数据集将对电信行业更为现实。