我目前正在处理我以前在R-Studio中处理过的数据集的更新版本。新的更新功能具有编码缺失值的功能,而不是将这些单元格留空。
这种编码的问题在于它们是数值值,这些值会干扰我的分析和建模,特别是关注年龄值(此列中的数值),从而使我的模型产生偏差。
我正在寻找一种方法,用R-Studio数据框中的N / A替换专门编码为缺失的值(例如,缺失值的代码是9998)。
答案 0 :(得分:0)
也许是这样?
[{
"operation": "shift",
"spec": {
"data": {
"*": {
"name": "&1.name",
"collection_id": "&1.collection_id",
"attributes": {
"*": {
"attribute_id": "&1.attribute_id[]"
}
},
"properties": {
"*": {
"name": "&1.myname[]",
"property_id": "&1.property_id[]"
}
}
}
}
}
}]