用R处理CSV文件 - 查找模式

时间:2016-04-28 23:44:54

标签: r database algorithm sorting csv

我的CSV文件中包含以下列," buildings.csv"。

var testObject = {
                  stringProperty: "hi",
                     intProperty: 4,
                  objectProperty: {},
                    nullProperty: null
                 };
var filterPrimitive = o => Object.keys(o).reduce((p,k) => {typeof o[k] != "object" && (p[k] = o[k]); return p},{});

document.write("<pre>" + JSON.stringify(filterPrimitive(testObject),null,2) + "</pre>");

我想做的是查看专栏,&#34;投诉类别&#34;然后确定哪个类别最多。它们被列为数字,例如,我看到四行数字12作为类别,三行数字15作为类别,20行数字1.我将R确定1是最常见的投诉类型共有20个独特的投诉。换句话说,我如何找到&#34;投诉类别&#34;的模式?这是我尝试过的代码。

Complaint Number    Status  Date Entered    House Number    House Street    BIN Community Board Special District    Complaint Category  Unit    Disposition Date    Disposition Code    Inspection Date DOBRunDate

为什么它不喜欢括号?意想不到的&#39;}&#39; in&#34; +}&#34;

buildings <- read.csv("buildings.csv")

Mode <- function(x) {
  +     ux <- unique(x)
  +     ux[which.max(tabulate(match(x, ux)))]
  + }



Mode(buildings$ComplaintCategory)

有人可以指导我找到最好的方法吗?感谢

1 个答案:

答案 0 :(得分:0)

你可以这样做:

buildings <- read.csv("buildings.csv")

Mode <- function(x) {
     tbl <- table(x)
     ans <- tbl[which.max(tbl)]
     return (ans)
}

Mode(buildings$ComplaintCategory)