我从网页上抓取了表格数据。一些清洁之后它出现在一个未命名的列中。
[1] John
[2] Smith
[3] Tina
[4] Jordan
and so on.....
我显然正在寻找结果:
FirstName | LastName
[1] John Smith
[2] Tina Jordan
et al.
使我达到这一点的大部分内容来自:http://statistics.berkeley.edu/computing/r-reading-webpages
对于像我这样的初学者来说,这是一个非常有用的资源。
如果您能给我任何建议,我将不胜感激。
谢谢, C R Eaton
答案 0 :(得分:2)
我们创建一个逻辑索引(' i1'),通过使用&提取原始数据集(' dat')的第一列中的元素来创建data.frame
#39; I1&#39 ;. ' i1'元素将循环到列的长度,所以如果我们执行' dat [i1,1]`,它将提取第一个元素,第3个,第5个等。对于姓氏,我们只是否定&#39 ; i1',以便它将提取第2,第4等。
i1 <- c(TRUE, FALSE)
d1 <- data.frame(FirstName = dat[i1,1], LastName = dat[!i1, 1], stringsAsFactors=FALSE)