R:使用带有波兰语字符的readtext()升级文档文件

时间:2019-04-21 13:37:19

标签: r unicode polish read-text

我们有一个.doc文件(DOC不是DOCX !!!!),其中包含以下波兰语句子:

” Nakażde40 mg%powyżej100 mg%dodać1j NovoRapidu,przy glikemiiponiżej100 mg%odjąć1j NovoRapidu od dawki wyliczonej na WW wposiłkugłównym。 Przekąskiliczyć1j / 1WW。 W przypadku hiperglikemii奖了snem,tj。好。天哪22.00,proszęliczyćna zbicie 1j NovoRapidu nakażde50 mg%powyżej150 mg%。 “

您也可以从HERE下载文件(my_doc.doc)

我想通过代码将此字符向量上传到R:

library(readtext)
path <- "path of the my_doc.doc"
Sys.setlocale("LC_CTYPE", "polish")
i <- readtext(path,encoding = "UTF-8")
#or
i <- readtext(path)
i$text

#[1] "Na ka?de 40 mg% powy?ej 100 mg% doda? 1j NovoRapidu, przy  glikemii  #poni?ej\r\n100 mg% odj?? 1j NovoRapidu od dawki wyliczonej na  WW  w  posi?#ku  g?ównym.\r\nPrzek?ski liczy? 1j/ 1WW. W przypadku  hiperglikemii  przed  #snem,  tj.  ok.\r\ngodz. 22.00, prosz? liczy? na zbicie 1j NovoRapidu na ka?#de 50  mg%  powy?ej\r\n150 mg%."

该代码独立于所使用的编码提供相同的输出。 我想在.doc文件和R中获得相同的文本。 我使用Windows。 我应该如何编辑我的代码?

0 个答案:

没有答案