python3无法运行tokenize

时间:2017-12-13 06:35:21

标签: python python-3.x xlrd

我运行此程序。调用[ Keitaisokaiseki ]。

但我收到了错误

Traceback (most recent call last):
   File "C:\Users\Mao\Desktop\形態素解析 ランキング(栃木県).py", line 23, in <module>
     tokens = t.tokenize(val)
   File "C:\Users\Mao\AppData\Local\Programs\Python\Python36-32\lib\site-
    packages\janome\tokenizer.py", line 194, in tokenize
    return list(self.__tokenize_stream(text, wakati, baseform_unk))
    File "C:\Users\Mao\AppData\Local\Programs\Python\Python36-32\lib\site-
    packages\janome\tokenizer.py", line 197, in __tokenize_stream
    text = text.strip()
   AttributeError: 'float' object has no attribute 'strip'

第194行

    return list(self.__tokenize_stream(text, wakati, baseform_unk))

第197行是

    text = text.strip()

给我任何指导。

2 个答案:

答案 0 :(得分:0)

查看您提供的代码,您正在尝试

tokenize(val)

其中val来自使用xlrd读取excel表。从here可以看出,xlrd调用的返回类型可以是一个浮点数,它可以解释你的错误,因为你给了一个浮点值给tokenize函数

答案 1 :(得分:0)

似乎你给tokenize()方法赋予了浮点值。

janome是一个日语“文本”分析引擎,因此您需要在调用tokenize()之前将数值转换为字符串。