Question

我不知道如何删除R中的某些因子。我有这样的数据：

District                       X
District - Purba Champaran    12
District - Purba Champaran    86
District - Purba Champaran    56
District - Sheohar            13 
District - Sheohar            45
District - Sheohar            13

我想从每个地区名称中删除“区 - ”部分。还请告诉我，如果某些地区名称在其名称中不包含“区域”，那该怎么办？

Answer 1

我们有：

sub

我们可以使用df[,1]<-sub('District - ','',df[,1])：df # District X # 1 Purba Champaran 12 # 2 Purba Champaran 86 # 3 Purba Champaran 56 # 4 Sheohar 13 # 5 Sheohar 45 # 6 Sheohar 13

df

它将删除＆＃34;区 - ＆＃34;来自第一列SELECT SPLIT_STR(fieldName, ',', 1) as abc, SPLIT_STR(fieldName, ',', 2) as 123, SPLIT_STR(fieldName, ',', 3) as aed, SPLIT_STR(fieldName, ',', 4) as ghi, FROM YourTable;的每一行。如果没有＆＃34;区 - ＆＃34;连续，它什么都不做。

从R中的因子中删除少数字符

1 个答案: