如何在R package Quanteda中使用LIWC格式的字典?

时间:2015-11-22 20:23:42

标签: r quanteda

由于LIWC软件和词典是专有的,我很高兴看到它们似乎与仍然在开发但优秀的R包Quanteda相得益彰。

R package Quanteda demonstrates its use with a LIWC-format dictionary的文档,就像SO post一样。

我购买了LIWC 2015,但无法解决如何在应用程序之外导出字典而不是PDF格式。

1 个答案:

答案 0 :(得分:3)

接受请求编辑(" LIWC的商业方面")

我不会建议您如何从包含需要购买的软件的Java Archive(.jar)文件中提取英语LIWC 2015字典。

与先前版本的LIWC软件不同,字典文件不直接与软件一起分发。但是,使用合法购买的序列号登录,您可以从http://dictionaries.liwc.net下载LIWC2007和LIWC2001(取决于语言)的非英语词典,其中包括德语,荷兰语,意大利语,俄语,法语和西班牙语版本

如果您的词典格式与LIWC词典的格式相同,例如Moral Foundations dictionary,那么这将有效:

require(quanteda)
mfdict <- dictionary(file = "http://www.moralfoundations.org/sites/default/files/files/downloads/moral%20foundations%20dictionary.dic", 
                    format = "LIWC")

将道德基础词典加载并转换为quanteda格式。您可以使用

在构建文档特征矩阵时使用字典
dfm(x, dictionary = mfdict)