Question

试图为一个宠物项目弄清楚一些东西，并且被卡住了：（

该项目围绕Tweet出现的顺序进行。我为2位演员收集了有关3个不同主题的推文。我想确定在每个特定主题上哪个演员的推文发生得较早。一位朋友建议我查看“ survival”包，但看不到它如何工作。任何建议都将受到欢迎！非常感谢！

编辑：其他信息

created_at           name
1544469754 chicagotribune
1541550304 chicagotribune 

party     type     topic
M         1        trade
M         1        trade

该变量表示以下信息

-创建时间：发tweet的时间

-名称：Twitter帐户名称

-政党：政治倾向的分类变量

- type ：二进制指示器（1 =介质类型A，0 =介质类型B）

- topic ：该推文所属的主题（共3个主题）

Answer 1

我认为这不是生存分析问题，您只需要在每个主题中找到最早的时间戳即可。我认为类似这样的方法应该起作用：

# Read in example data
df = readr::read_table("created_at           name    party     type     topic
1544469754 chicagotribune    M         1        trade
1541550304 chicagotribune    M         1        trade")

df %>%
    group_by(topic) %>%
    summarise(first_tweeter = name[which.min(created_at)])

如何确定推文的发生顺序（生存分析？）？

1 个答案: