根据前一行中的值提取数据

时间:2017-08-10 13:30:15

标签: python database excel python-3.x pandas

我收到了一个包含约60K行数据的Excel文件,其中包含有关用户与文本消息应用程序交互的信息。一个更简单的数据示例如下: Example of Data

我需要根据对前一行中询问的每个唯一用户ID的问题的响应来提取信息。例如,如果有一条外发消息:“你开始感觉多久就感觉不舒服?”和一条显示“3”的传入消息,我想为每个用户ID创建一个变量“Sick_Start_Date”从他们回答问题之日开始生病并减去3。在上面的例子中,它将是7/11/2017。 我可以用Excel中的一些公式蛮力来做到这一点,但我想可能有更好的“QA-able”方式来分析以这种方式构造的数据。 其他需要考虑的复杂性:

  • 如果用户在几毫秒内响应消息,则为数据文件 经常没有得到正确的订单 - 它可能记录两个传出 消息,然后传入消息,即使它是明确的 传入消息发生在两个传出消息之间

  • 用户并不总是回复并发送多个外发消息

0 个答案:

没有答案