从R中的因子中删除少数字符

时间:2015-12-03 07:35:40

标签: r filter dataframe

我不知道如何删除R中的某些因子。 我有这样的数据:

District                       X
District - Purba Champaran    12
District - Purba Champaran    86
District - Purba Champaran    56
District - Sheohar            13 
District - Sheohar            45
District - Sheohar            13

我想从每个地区名称中删除“区 - ”部分。 还请告诉我,如果某些地区名称在其名称中不包含“区域”,那该怎么办?

1 个答案:

答案 0 :(得分:4)

我们有:

sub

我们可以使用df[,1]<-sub('District - ','',df[,1])df # District X # 1 Purba Champaran 12 # 2 Purba Champaran 86 # 3 Purba Champaran 56 # 4 Sheohar 13 # 5 Sheohar 45 # 6 Sheohar 13

df

它将删除&#34;区 - &#34;来自第一列 SELECT SPLIT_STR(fieldName, ',', 1) as abc, SPLIT_STR(fieldName, ',', 2) as 123, SPLIT_STR(fieldName, ',', 3) as aed, SPLIT_STR(fieldName, ',', 4) as ghi, FROM YourTable; 的每一行。如果没有&#34;区 - &#34;连续,它什么都不做。