计算两列的相关分布百分比

时间:2018-07-17 14:48:38

标签: r statistics relationship percentage

我正在处理具有多个数据列的数据集。

在此数据集中,我计算了两列中2列的分位数,并将分位数的结果转换为2个新列,其中每个单元格显示了属于的四分位数。

Image of quartiles columns

现在,我想获得这2列之间的分布式关系。 我的意思是,例如,当第1列的结果为4时,与第2列的结果有什么关系?

例如:

当第1列的结果为4时=第1列的30%,2的20%,3的40%,第2列的4的10%

结果为1,2,3 ...时也是如此...

也许我要寻找的名称在统计信息中有名字,但不确定是什么。

有人可以帮忙吗?

非常感谢。

1 个答案:

答案 0 :(得分:0)

import org.scalatest.WordSpec
import play.api.libs.json.Json.reads
import play.api.libs.json.{Json, _}

class ReadsExample extends WordSpec {

  "read" in {
    val sales =
      """
          {
            "id_from_API": 9,
            "sale_type": {
              "main" : "a",
              "sub" : "b"
          }
      }
    """.stripMargin

    val salesJson: JsValue = Json.parse(sales)
    val salesData = salesJson.as[Sales]
  }

}

case class Sales(id_from_API: Int, sale_type: SaleType)
case class SaleType(main: String, sub: String)

object Sales {
  implicit val st: Reads[SaleType] = reads[SaleType]
  implicit val of: Reads[Sales] = reads[Sales]
}