Watson DSX获得了“索引错误”但Docker Jupiter环境。别

时间:2017-10-15 09:45:26

标签: python data-science-experience

我在Watson DSX上运行以下Python脚本并出现错误。 (IndexError:列表索引超出范围)

(1)相同程序在Docker Jupiter笔记本环境中正常运行。

(2)在Waston上,如果输入文件大小变小,则DSX正常运行。

请告诉我这是什么原因,我应该怎么做才不会出现错误?

!pip install janome
data = get_object_storage_file_with_credentials_8b9fb794cc1049b09563d144c8861966('KITDemo', 'kusa-out.txt')
#data = get_object_storage_file_with_credentials_8b9fb794cc1049b09563d144c8861966('KITDemo', 'kusa2-out.txt')
txt = data.getvalue()

word_list = []
from janome.tokenizer import Tokenizer
t = Tokenizer()
for token in t.tokenize(txt, stream=True):
    partOfSpeech = token.part_of_speech.split(',')[0]
    if partOfSpeech == u'名詞':
        word_list.append(token.surface)

这是完整的堆栈跟踪。

IndexError Traceback (most recent call last)
<ipython-input-4-9a7681ae1aa6> in <module>()
      2 from janome.tokenizer import Tokenizer
      3 t = Tokenizer()
----> 4 for token in t.tokenize(txt, stream=True):
      5     partOfSpeech = token.part_of_speech.split(',')[0]
      6     if partOfSpeech == u'名詞':

Screenshot

1 个答案:

答案 0 :(得分:0)

IndexError: list index out of range修复了Janome版本0.3.6。 https://github.com/mocobeta/janome/blob/0.3.6/CHANGES.txt

请升级janome。如果升级后仍有问题,请在此处创建问题。 https://github.com/mocobeta/janome/issues