R从文本文件中导入int编码的单词的向量

时间:2016-03-02 11:56:14

标签: r

我有一个带有矢量字的文本文件,其字符用整数表示。文本文件如下所示:

x<-c(intToUtf8(c(105,110,100,105,118,105,100,117,117,109)), intToUtf8(c(101,105,110,122,101,108,112,101,114,115,111,110)),...)

要在R中使用它们,请复制文本文件的内容并将其粘贴到R中,当我想看到&#39; x&#39;的值时。它给了我:

[1] word1   word2

现在我的文本文件包含9000个单词,当我复制粘贴时,将所有单词加载到R中需要很长时间,并且在进入新行时总会出现错误。

所以我试过了:

x <- readLines("text.txt")
y <- c(x)
y
[1] "intToUtf8(c(105,110,100,105,118,105,100,117,117,109)),intToUtf8(c(101,105,110,122,101,108,112,101,114,115,111,110))"

正如您所看到的,结果不是我需要的。

我也尝试用read.table()加载它,它给了我一个只有一个元素位于[1,&#34; V1&#34;]然后使用该元素的表,但它也没有用。

如何将带有单词的向量加载到R中?我的结果与我只是复制粘贴的结果相同。

谢谢。

1 个答案:

答案 0 :(得分:0)

你可以做到

SELECT t1.User, t1.TimeStamp, t1.Kind
FROM mytable AS t1
INNER JOIN (
   SELECT User, 
          MIN(CASE WHEN Kind = 'ok' THEN TimeStamp END) AS ok_time,
          MAX(CASE WHEN Kind = 'err' THEN TimeStamp END) AS err_time
   FROM mytable
   GROUP BY User
) AS t2 ON t1.User = t2.User 
WHERE t1.TimeStamp BETWEEN t2.ok_time AND t2.err_time