html文件以R而不是希伯来字符显示问号

时间:2019-05-31 21:58:45

标签: r encoding hebrew

R似乎支持除我的htm文件之外的所有内容和文件类型的希伯来语输入和输出。

我尝试在R中设置语言环境和编码,并使用UTF-8编码保存htm文件。问题似乎不在于R,而是htm文件本身,因为它在文本编辑器中显示了相同的内容。但是,它可以正确显示在预览浏览器窗口中。

这是我已经在R中尝试过的圆顶代码。

Sys.setlocale("LC_ALL","Hebrew")
locale = locale(date_names = "he", encoding = "UTF-8"))
locale("he") 

这是我在R控制台中打印文件时的样子...

    <!DOCTYPE HTML PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//HE\">\n<HTML DIR=\"RTL\" LANG=\"HE\">\n<HEAD>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset==Windows-1255\">\n<!--Copyright 2003 Mechon Mamre, 12 Hayyim Vital, Jerusalem-->\n<LINK REL=\"stylesheet\" HREF=\"x.css\" TYPE=\"text/css\">\n<TITLE>??\"? ????? ?????? - ??????" 

我之前已经解决了这个问题……我想我只是将文件另存为UTF-8,但是最近我从Windows 10迁移到了Ubuntu 18,这不再起作用了。

1 个答案:

答案 0 :(得分:0)

似乎您要求R读取UTF-8,文件为cp-1255。

您应该将文件重新保存为UTF-8(并相应地更新标题)。