如何将每日活动数据与累积数据进行比较?

时间:2020-09-29 04:24:41

标签: python pandas matplotlib graph hypothesis-test

所以我正在研究美国德克萨斯州的COVID-19数据。 我得到了两个假设进行研究

  1. 住院率越高,死亡率越高?
  2. ICU率越高,死亡率越高。

致命数据-https://dshs.texas.gov/coronavirus/TexasCOVID19DailyCountyFatalityCountData.xlsx

住院/ ICU数据-https://dshs.texas.gov/coronavirus/CombinedHospitalDataoverTimebyTSA.xlsx

因此,证明这些假设的基本方法应该是比较累积/每日病死率数据与累积/每日住院/ ICU数据。

与此相关的主要问题是,死亡率数据是累积累计量,而住院/ icu数据是每天的活动数。无论如何,如果可以的话,这两个可以比较吗?还是我们能做些什么?

1 个答案:

答案 0 :(得分:0)

累计数据是每日数据的总和版本,相反,每天数据是差分总和数据。

我假设每天累积的死亡人数是多少,因此您可以提取具有差异的每日死亡人数(例如np.diff)。这样,每个数据将成为每日数字。请注意,在这种情况下,您最终会遗失一个点(最后)。

您还可以决定累积要累积的住院次数或ICU数据与设施的累积数量进行比较。