标签: r text-mining
我有很多.rtf文件(数百个)。我需要将它们转换为文本格式以进行文本挖掘。我认为通过首先将rtf转换为pdf然后将pdf转换为文本(这样就不会发生数据丢失)来实现这一目标的最佳方式。 有没有其他可行的方法呢? R中的包'tm'是否有某种方法来创建.rtf文件的语料库?