我现在使用Rstudio 3.4.3版本,我尝试使用包 tm 分析法语PDF文档。
我的问题是,即使我使用此命令my_pdf <- readPDF (control = list (text = "- layout")) (elem = list (uri = "C: /Users/lo/Desktop/Eau/Catalogs.pdf", language = "fr"))
指定文档的语言。有些单词写得不好,例如我找到了而不是单词&#34; nourrice&#34;这个词&#34; nourric&#34;而是&#34;描述&#34;单词&#34; descript&#34;。
你知道我怎么能解决这个问题吗?