在我的数据集(关于枪支暴力)中,每列都有||在数据点之间。
例如年龄
0::Male||1::Female||2::Male||
如何分隔数据点?
谢谢!
答案 0 :(得分:0)
read.table
/ read.delim
允许您定义单个字符,通过该字符分隔每行中的值(请参阅sep
中的参数?read.table
)
由于您有||
,我们需要做的就是在读取数据时删除生成的NA
列。
以下是一个例子:
# Sample data
df <- read.table(text =
"0::Male||1::Female||2::Male||
0::Male||1::Female||2::Male||
0::Male||1::Female||2::Male||
0::Male||1::Female||2::Male||", sep = "|")
# Remove NA columns
df[, !sapply(df, function(x) all(is.na(x)))]
# V1 V3 V5
#1 0::Male 1::Female 2::Male
#2 0::Male 1::Female 2::Male
#3 0::Male 1::Female 2::Male
#4 0::Male 1::Female 2::Male