替换拼写错误的单词

时间:2016-07-22 11:48:00

标签: r gsub tm

我有一个25000行的城市列,数据框中有很多错误拼写的城市。样本如下所示

Vishakapatnam, a.p
Vishakapatnam URBAN
Vishakapatnam Distt.
Vishakapatnam
Vishakapatnam
vghjfg"
vgfsgsvsw
Vellore
Vellore
VELLORE
VELLORE
New deklhi
New Dehli
new dehli
NEW DEHI
xxxx

zz
a
1234
5644
3

数据包含具有不同拼写,数字,空格和一些随机字母的城市。我想把拼写错误的城市改成一个名字并删除空格,没有意义和数字的字母。我正在尝试使用grep,正如这里的一些答案所提到的那样,但它是如此乏味。此外,我尝试使用TM包,但我无法实现这一点。有人可以分享我们可以更有效地做到这一点的任何方法。

0 个答案:

没有答案