使用R阻止数据框中的文本列

时间:2017-03-06 09:23:21

标签: r dataframe stemming

我有一个具有这种结构的数据框:

#Load lexicon
Lexicon_DF <- read.csv("LexiconFrancais.csv",header=F, sep=";") 

&#34; LexiconFrancais.csv&#34;是这样的:

French Translation (Google Translate);Positive;Negative
un dos;0;0
abaque;0;0
abandonner;0;1
abandonné;0;1
abandon;0;1
se calmer;0;0
réduction;0;0
abba;1;0
abbé;0;0
abréger;0;0
abréviation;0;0



> Lexicon_DF
                                         V1       V2       V3
1     French Translation (Google Translate) Positive Negative
2                                    un dos        0        0
3                                    abaque        0        0
4                                abandonner        0        1
5                                 abandonné        0        1
6                                   abandon        0        1
7                                 se calmer        0        0
8                                 réduction        0        0
9                                      abba        1        0
10                                     abbé        0        0
11                                  abréger        0        0
12                              abréviation        0        0

我试图阻止数据帧的第一列,为此我做了:

Lexicon_DF <- SnowballC::wordStem(Lexicon_DF[[1]], language = 'fr')

但是在这个命令之后我只找到了Lexicon_DF数据帧中的第一列,另外两列就消失了。

> Lexicon_DF <- SnowballC::wordStem(Lexicon_DF[[1]], language = 'fr')
> Lexicon_DF
   [1] "French Translation (Google Translate)" "un dos"                                "abaqu"                                
   [4] "abandon"                               "abandon"                               "abandon"                              
   [7] "se calm"                               "réduct"                                "abba"                                 
  [10] "abbé"                                  "abreg"                                 "abrévi" 

如何在不遗漏其他两列的情况下进行干扰?

谢谢

1 个答案:

答案 0 :(得分:1)

您正在尝试使用wordStem的o / p替换Lexicon_DF的全部内容 -

试试这个:

Lexicon_DF$V1 <-SnowballC::wordStem(Lexicon_DF[[1]], language = 'fr')