试图为一个宠物项目弄清楚一些东西,并且被卡住了:(
该项目围绕Tweet出现的顺序进行。我为2位演员收集了有关3个不同主题的推文。我想确定在每个特定主题上哪个演员的推文发生得较早。一位朋友建议我查看“ survival”包,但看不到它如何工作。任何建议都将受到欢迎!非常感谢!
编辑:其他信息
created_at name
1544469754 chicagotribune
1541550304 chicagotribune
party type topic
M 1 trade
M 1 trade
该变量表示以下信息
-创建时间:发tweet的时间
-名称:Twitter帐户名称
-政党:政治倾向的分类变量
- type :二进制指示器(1 =介质类型A,0 =介质类型B)
- topic :该推文所属的主题(共3个主题)
答案 0 :(得分:2)
我认为这不是生存分析问题,您只需要在每个主题中找到最早的时间戳即可。我认为类似这样的方法应该起作用:
# Read in example data
df = readr::read_table("created_at name party type topic
1544469754 chicagotribune M 1 trade
1541550304 chicagotribune M 1 trade")
df %>%
group_by(topic) %>%
summarise(first_tweeter = name[which.min(created_at)])