所有
我有numpy.ndarray,每行包含字符串,其尺寸为(600,)。
我编写的代码,我认为,它可以找到所有不是单词或数字的代码。
我想要做的是拆分只包含单词或数字的字符串。 所有的字符串都不同,可能有其他人没有的某些字符。
例如: " [姓名] Jayganesh [laSt] Kalla [年龄] 24岁,这太酷了!"
它回复: ['姓名',' Jayganesh',' laSt',' age',' 24','这个','是'所以',很酷'] 输入:
re.findall(r'\W', summary_data[23,])
输出:
['[',
']',
' ',
'[',
']',
' ',
' ',
' ',
' ',
' ',
"'",
' ',
' ',
' ',
' ',
' ',
' ',
' ']
我认为我走在正确的轨道上并尝试使用拆分功能,但它没有用。
提前致谢:)