如何在R中将因子更改为字符串

时间:2015-04-02 17:17:29

标签: xml r dataframe

我正在使用数据框,这是一个序列列表

Alpha_Helix = xmlParse("AlphaTbl.Xml")
all_seq = getNodeSet(Alpha_Helix, path = "//Protein/sequence", )
all_seq = xmlToDataFrame(all_seq)

我想在每一行中找到序列的长度,然后对序列进行其他一些工作,但是访问它们时遇到了麻烦。

当我尝试:

length(all_seq$text[1])
[1] 1
nchar(all_seq$text)
Error in nchar(all_seq$text) : 'nchar()' requires a character vector
nchar(all_seq$text[1])
Error in nchar(all_seq$text[1]) : 'nchar()' requires a character vector


as.character(all_seq) # Works
[1] "c(117, 91, 8)"

我如何访问字符串?

2 个答案:

答案 0 :(得分:1)

您是否尝试过在as.character包裹您的矢量?

答案 1 :(得分:0)

好的我用Google搜索并找到了有用的东西。

require(stringi)
require(stringr)

str_length(all_seq$text)
[1]  249  274  261 
stri_length(all_seq$text)
[1]  249  274  261

适合我。