我正在使用数据框,这是一个序列列表
Alpha_Helix = xmlParse("AlphaTbl.Xml")
all_seq = getNodeSet(Alpha_Helix, path = "//Protein/sequence", )
all_seq = xmlToDataFrame(all_seq)
我想在每一行中找到序列的长度,然后对序列进行其他一些工作,但是访问它们时遇到了麻烦。
当我尝试:
length(all_seq$text[1])
[1] 1
nchar(all_seq$text)
Error in nchar(all_seq$text) : 'nchar()' requires a character vector
nchar(all_seq$text[1])
Error in nchar(all_seq$text[1]) : 'nchar()' requires a character vector
as.character(all_seq) # Works
[1] "c(117, 91, 8)"
我如何访问字符串?
答案 0 :(得分:1)
您是否尝试过在as.character
包裹您的矢量?
答案 1 :(得分:0)
好的我用Google搜索并找到了有用的东西。
require(stringi)
require(stringr)
str_length(all_seq$text)
[1] 249 274 261
stri_length(all_seq$text)
[1] 249 274 261
适合我。