我们有一个.doc文件(DOC不是DOCX !!!!),其中包含以下波兰语句子:
” Nakażde40 mg%powyżej100 mg%dodać1j NovoRapidu,przy glikemiiponiżej100 mg%odjąć1j NovoRapidu od dawki wyliczonej na WW wposiłkugłównym。 Przekąskiliczyć1j / 1WW。 W przypadku hiperglikemii奖了snem,tj。好。天哪22.00,proszęliczyćna zbicie 1j NovoRapidu nakażde50 mg%powyżej150 mg%。 “
您也可以从HERE下载文件(my_doc.doc)
我想通过代码将此字符向量上传到R:
library(readtext)
path <- "path of the my_doc.doc"
Sys.setlocale("LC_CTYPE", "polish")
i <- readtext(path,encoding = "UTF-8")
#or
i <- readtext(path)
i$text
#[1] "Na ka?de 40 mg% powy?ej 100 mg% doda? 1j NovoRapidu, przy glikemii #poni?ej\r\n100 mg% odj?? 1j NovoRapidu od dawki wyliczonej na WW w posi?#ku g?ównym.\r\nPrzek?ski liczy? 1j/ 1WW. W przypadku hiperglikemii przed #snem, tj. ok.\r\ngodz. 22.00, prosz? liczy? na zbicie 1j NovoRapidu na ka?#de 50 mg% powy?ej\r\n150 mg%."
该代码独立于所使用的编码提供相同的输出。 我想在.doc文件和R中获得相同的文本。 我使用Windows。 我应该如何编辑我的代码?