Question

我目前正在处理我以前在R-Studio中处理过的数据集的更新版本。新的更新功能具有编码缺失值的功能，而不是将这些单元格留空。

这种编码的问题在于它们是数值值，这些值会干扰我的分析和建模，特别是关注年龄值（此列中的数值），从而使我的模型产生偏差。

我正在寻找一种方法，用R-Studio数据框中的N / A替换专门编码为缺失的值（例如，缺失值的代码是9998）。

Answer 1

也许是这样？

[{
    "operation": "shift",
    "spec": {
      "data": {
        "*": {
          "name": "&1.name",
          "collection_id": "&1.collection_id",
          "attributes": {
            "*": {
              "attribute_id": "&1.attribute_id[]"
            }
          },
          "properties": {
            "*": {
              "name": "&1.myname[]",
              "property_id": "&1.property_id[]"
            }
          }
        }
      }
    }
  }]

用N / A替换数据框中的特定数值

1 个答案: