由于LIWC软件和词典是专有的,我很高兴看到它们似乎与仍然在开发但优秀的R包Quanteda相得益彰。
R package Quanteda demonstrates its use with a LIWC-format dictionary的文档,就像SO post一样。
我购买了LIWC 2015,但无法解决如何在应用程序之外导出字典而不是PDF格式。
答案 0 :(得分:3)
接受请求编辑(" LIWC的商业方面")
我不会建议您如何从包含需要购买的软件的Java Archive(.jar)文件中提取英语LIWC 2015字典。
与先前版本的LIWC软件不同,字典文件不直接与软件一起分发。但是,使用合法购买的序列号登录,您可以从http://dictionaries.liwc.net下载LIWC2007和LIWC2001(取决于语言)的非英语词典,其中包括德语,荷兰语,意大利语,俄语,法语和西班牙语版本
如果您的词典格式与LIWC词典的格式相同,例如Moral Foundations dictionary,那么这将有效:
require(quanteda)
mfdict <- dictionary(file = "http://www.moralfoundations.org/sites/default/files/files/downloads/moral%20foundations%20dictionary.dic",
format = "LIWC")
将道德基础词典加载并转换为quanteda格式。您可以使用
在构建文档特征矩阵时使用字典dfm(x, dictionary = mfdict)