我有一个期刊文章标题摘要和作者的数据框架,这些文章是通过抓取在线期刊创建的。数据是文本密集型文件,所以我正在努力减少重复。
数据当前如下所示:
Title,Abstract,Authors
t1,ab1,au1
t1,ab1,au2
t2,ab2,au3
t3,ab3,au4
我想用分隔符将多位作者聚合为一行,如下所示:
Title,Abstract,Authors
t1,ab1,au1|au2
t2,ab2,au3
t3,ab3,au4
我尝试使用tidyverse中的spread()
,但这使我有多个作者专栏。由于文章的作者人数变化很大,所以这不是理想的解决方案。