为什么Mecab无法在docker上解析文本?

时间:2019-04-19 07:52:10

标签: python docker mecab

我正在使用mecab解析日语文本并提取名词。在服务器上工作正常。但是,当我尝试运行docker容器时,它会列出所有单词,但不会过滤掉单词。这是某种编码问题吗?

m = MeCab.Tagger('-Ochasen')
    excluded_part = ['名詞-接続-一般', '名詞-接尾-人名', '名詞-数']
    parsed = m.parse(text)
    df_parsed = pd.read_csv(
        StringIO(parsed), delimiter='\t',
        names=['単語', '読み', '原形', '品詞', '活用', '活用形'
    df_parsed = df_parsed[
            (df_parsed.品詞.str.contains('名詞')) &
            (~df_parsed.品詞.isin(excluded_part))]

它将删除字符')| 〜',但不会在docker容器中删除。

0 个答案:

没有答案