从文件excel序列项目0中的数组数据中使用nltk进行错误标记化:预期的str实例,找到了列表

时间:2019-04-22 15:10:35

标签: python nltk tokenize

我在这段代码中有问题,也许有人帮助,成功显示了excel文本中的数据列['hadis']

train['hadis'] = train['hadis'].apply(lambda x: " ".join([nltk.tokenize.word_tokenize(x) for x in x.split()]))
train['hadis'].head()
  

TypeError:序列项0:预期的str实例,找到了列表

将每行数据标记化的结果

1 个答案:

答案 0 :(得分:0)

代替

lambda x: " ".join([nltk.tokenize.word_tokenize(x) for x in x.split()])

使用

lambda x: " ".join(nltk.tokenize.word_tokenize(x))