如何删除R中某个字符后的每一个字母?

时间:2016-09-06 11:58:02

标签: r gsub

我在清理交易时遇到问题。我对客户所做的每一笔交易都有一个擅长,包括行业的数量,光泽度和代码。我将这个excel转换为以";"分隔的文本。然后我只需要清理光泽并将其转换回excel。

tolower(tabla1)
lapply(tabla1, tolower)
tabla1[] <- lapply(tabla1, tolower)
str(tabla1)
tabla1
tabla1_texto <- gsub("[.]", "", tabla1)
table1_texto <- gsub("[(]", " ", tabla1_texto)

我知道我需要使用gsub(),但我不确定如何使用它,另一方面,有人知道如何使用正确的字典,只保留某些字词并删除其他所有字词?

1 个答案:

答案 0 :(得分:0)

如果您有这样的字符串:

string <- "Some text here; and some text here; and some more text here"

然后您可以删除第一个;之后的所有内容:

gsub(";.*$", "", string)
[1] "Some text here"

;,*$的解释,你将替换""(空字符串):

  • ;
  • 开头
  • 任何字符.零次或多次*
  • 直至行$
  • 的结尾

如果你有一张桌子 - 你必须分别为每一行做这件事。