我有一个杂货销售数据,其中包含11个列,如商店名称,商品名称,价格等。对于我的分析,我不需要所有列值。我只需要几个列值来生成报告。
这是什么R代码?
示例:以下是销售数据的列名称。我只需要以下列值中的6个。我尝试了编码,但是显示了错误,还有那些我不理解的答案
STORE_NAME STORE_ID DEVICE_SERIAL_NUMBER BILL_NUMBER BARCODE ITEM_NAME VARIANT_NAME BASEPACK CATEGORY BRAND MANUFACTURER QUANTITY_SOLD PRICE PURCHASE_PRICE SELLING_PRICE SALES_VAT USER_NAME COUNTER CUSTOMER_NAME CUSTOMER_PHONE BILL_DATE CREATED_DATE
答案 0 :(得分:0)
使用read.table
或read.csv
读取所有数据,然后仅提取您可以使用的数据。这就是我们在R
中使用方括号的原因。您可以按列号或列名称来执行此操作:
lots.of.cols <- data.frame(a=1:20, b=2:21, c=3:22, d=runif(20), e=runif(20))
only.first.two.cols <- lots.of.cols[,c(1,2)] #extract only column 1 and 2
str(only.first.two.rows)
only.a.and.b <- lots.of.cols[,c("a", "b")]
str(only.a.and.b)