基于字符串匹配R

时间:2019-01-16 23:38:27

标签: r data-cleaning stringr stringi

我遇到一个字符清理边缘情况的数据清理问题。参见下面两个相同输出的单独实例(循环运行)。第一个格式正确,因为被抓取的表具有应具有的所有值。第二个表缺少值(不是空格,这会使操作更容易)。我想添加对某些关键字的检查,例如“ Current”或“ 52wkAvg”在同一向量元素中出现两次,然后添加NA或什至空白,如果存在,则将多余的单词向下移动一位。在此步骤之前,向量中已经存在NA。然后,我可以取消列出向量并将其放回原处。痛苦但任何帮助将不胜感激,因为这种情况不是经常发生,而是在发生时才是真正的问题!谢谢!

test22 “当前股价$ 6.41”“当前资产净值$ 7.09”“当前溢价/折价-9.59%”“ 52WkAvg股价$ 6.54”
“ 52WkAvg资产净值$ 7.21”“ 52WkAvg溢价/折扣-9.19%”“ 52WkAv高股价$ 6.88”“ 52WkHigh资产净值$ 7.34”“ 52WkHigh资产溢价/折扣-5.88%”“ 52WkLow股价$ 6.05”“ 52WkLow资产净值$ 7.03”“ 52WkLow溢价/ Dis。 %“

“当前股价$ 20.01”“当前资产净值$ 21.09”“当前溢价/折价-5.12%”“ 52WkAvg股价$ 19.31”
“ 52WkAvg资产净值$ 20.36”“ 52WkAvg溢价/折扣52WkHigh”“ 52WkLow股价不适用”“ 52WkLow资产净值”
“ 52WkLow溢价/折扣NA”“ NA股价NA”“ NA NAV NA”“ NA溢价/折扣NA”

0 个答案:

没有答案