我希望有人可以帮助我,或者至少给我一个好的建议。 我有一个大型数据框来存储科学论文(按作者/年份/期刊分类)。大多数科学论文给了我更多的记录,所以我试着写一个函数(直到现在都没有成功)给我一个唯一的值(命名为n)来识别记录所属的论文。
答案 0 :(得分:2)
要计算唯一值,您可以使用digest
包中的digest
函数。
例如,
library(digest)
digest(c("Granger", "1987", "Econometrica"))
为发布返回唯一的MD5字符串。 digest
无法呈现,即您必须使用sapply
或类似内容来计算数据框每一行的ID。