如何确定推文的发生顺序(生存分析?)?

时间:2019-03-06 04:35:08

标签: r twitter time-series survival-analysis

试图为一个宠物项目弄清楚一些东西,并且被卡住了:(

该项目围绕Tweet出现的顺序进行。我为2位演员收集了有关3个不同主题的推文。我想确定在每个特定主题上哪个演员的推文发生得较早。一位朋友建议我查看“ survival”包,但看不到它如何工作。任何建议都将受到欢迎!非常感谢!

编辑:其他信息

created_at           name
1544469754 chicagotribune
1541550304 chicagotribune 

party     type     topic
M         1        trade
M         1        trade

该变量表示以下信息

-创建时间:发tweet的时间

-名称:Twitter帐户名称

-政党:政治倾向的分类变量

- type :二进制指示器(1 =介质类型A,0 =介质类型B)

- topic :该推文所属的主题(共3个主题)

1 个答案:

答案 0 :(得分:2)

我认为这不是生存分析问题,您只需要在每个主题中找到最早的时间戳即可。我认为类似这样的方法应该起作用:

# Read in example data
df = readr::read_table("created_at           name    party     type     topic
1544469754 chicagotribune    M         1        trade
1541550304 chicagotribune    M         1        trade")

df %>%
    group_by(topic) %>%
    summarise(first_tweeter = name[which.min(created_at)])