我正在尝试从数据框中删除所有空行。问题是这些行并非完全为空,有些行有一个空格,其他行有多个空格和换行。
以下是示例:
new_tweetsdf[[35]]
[1] " \n \n \n"
#second example
new_tweetsdf[[102]]
[1] " \n"
#third example
new_tweetsdf[[188]]
[1] " "
#fourth example
new_tweetsdf[[4671]]
[1] "\n\n"
#fourth example
new_tweetsdf[[11326]]
[1] "\n\n\n\n"
#fifth example
new_tweetsdf[[27137]]
[1] "\n\n\n\n \n"
我尝试了一些解决方案。首先,我尝试删除所有空且不包含空格的行
new_tweetsdf <- new_tweetsdf[rowSums(new_tweetsdf==" ") | rowSums(new_tweetsdf=="") !=ncol(new_tweetsdf), ]
但是我剩下的空行包含\ n或多行。这也使得很难根据字符数删除行
我还考虑过删除所有不以字母开头的行
new<- new_tweetsdf[grep('^[a-z]',new_tweetsdf)]
但是,这大约删除了我的第5行,从观察来看,我的数据帧中似乎没有太多的空白。这可能还会删除以空格开头但实际上有字母的行
这里是我正在使用的数据的链接: Data
答案 0 :(得分:1)
您可以使用简单的正则表达式删除所有索引。
char array[][6] = {"game", "house"};
此模式将匹配仅包含“空格,制表符,垂直制表符,换行符,换页和回车”的所有行。因此,我们需要反转结果,因为我们想要相反的结果。
array[0]