我正在编写一个重写列名的函数,以便在标准中输出data.table。输入是用户提供的data.tables,可能因多个名称而不同。
以下格式应该是所有输入data.tables的输出:
length width height weight
输入data.tables可能看起来像,例如
input_dt = data.table(
length = 194,
wide = 36,
tall = 340,
kilogram = 231.2
)
我的函数将此data.table(或data.frame)作为输入,并更改列,输出此data.table:
length width height weight
194 36 340 231.2
我为该功能创建了一个key
,用于检查可能的名称:
key = list(
length = c('long'),
width = c('girth', 'WIDTH', 'wide'),
height = c('tall', 'high'),
weight = c('Weight', 'WEIGHT', 'kilogram', 'pound', 'kilograms', 'pounds')
)
现在,在函数中,我可以检查input_dt
的输入列名称,以检查是否需要通过检查交集来更改它们:
> intersect(names(input_dt), unlist(key))
[1] "wide" "tall" "kilogram"
然后适当地改变这些。我的问题是:
编写这个自定义函数将充满for循环,效率非常低。是否有其他更多数据。可用的友好解决方案,给定一个定制的"密钥"价值观?
答案 0 :(得分:2)
保持<div ng-controller="Ctrl1">
address : {{data.agreement.property_address}}<br>
city : {{data.agreement.property_city}}<br>
state: {{data.agreement.property_state}}<br>
<br>
name : {{data.user.name}}<br>
email : {{data.user.email}}<br>
phone: {{data.user.phone}}<br>
</div>
不是key
而是list
,然后合并:
data.table
之后使用# easier to edit this list if you need to update your keywords later
key_list = list(
length = c('long'),
width = c('girth', 'WIDTH', 'wide'),
height = c('tall', 'high'),
weight = c('Weight', 'WEIGHT', 'kilogram', 'pound', 'kilograms', 'pounds')
)
# build into data.table
keyDT = data.table(
# can't name a column key
key_name = rep(names(key_list), lengths(key_list)),
synonym = unlist(key_list),
# easier merging
key = 'synonym'
)
# nomatch = 0 to skip unmatched columns
keyDT[.(names(input_dt)), setnames(input_dt, synonym, key_name), nomatch = 0L]
:
input_dt
为了提高稳定性,您可能希望将自我添加到input_dt
# length width height weight
# 1: 194 36 340 231.2
(例如key_list
);这样,如果length = c('length', 'long')
名称中有一个尚未见过的input_dt
,您就可以更轻松地抛出错误/警告。