我有一个数据框,列出了特定年份的名称,名称数量。当我将其子集化以查找特定名称时,请说James
,我无法绘制子集。它来自一个数据框,其中一列列出了名称(数千个),一个列出了年份,一个列出了性别(M或F),还有一个列表编号。我也按性别分开了。主数据框称为df1。
这是df1的第10行。没有专栏被称为年...
Name Gender Number Date
1 Mary F 7065 ob1880
2 Anna F 2604 ob1880
3 Emma F 2003 ob1880
4 Elizabeth F 1939 ob1880
5 Minnie F 1746 ob1880
6 Margaret F 1578 ob1880
7 Ida F 1472 ob1880
8 Alice F 1414 ob1880
9 Bertha F 1320 ob1880
10 Sarah F 1288 ob1880
df.james = subset(df1,df1 =="James")
df.split = split(df.james,df.james$Gender)
df.male = df.split$M
tbl = table(df.male) #this is the bit that doesn't work.
我收到以下错误:
向量中的错误("整数",长度):向量大小不能为NA
另外:警告信息:
1:在pd *(as.integer(cat) - 1L)中:整数溢出产生的NA 2:在bin + pd *(as.integer(cat) - 1L)中:由整数溢出产生的NA 3:在pd * nl中:整数溢出产生的NAs
此外,当我尝试将该子集中的两列列表时,它似乎包含了原始数据框中的大量值。