python程序在给定的字符串中放置正确的标点符号

时间:2018-07-16 07:01:21

标签: python text nltk text-mining

我想在给定的段落中添加很多标点符号,以标出正确的标点符号。

例如:-
输入:嘿,你今天好吗
输出:嘿,你好吗?你今天能来吗?

我只想拆分句子以隔离问题部分和陈述部分。基本上,我只需要输入“。”和“?”在适当的地方。

是否有任何协议可以这样做。 任何建议将不胜感激。

2 个答案:

答案 0 :(得分:0)

这是一个简单的算法,它将检查单词“嘿”并在其后添加一个逗号:

def format(string):
    # get list split by spaces
    parsed_string = string.split(' ')
    i = 0
    for word in parsed_string:
        # check if word is 'hey'
        if word == 'hey':
            # add a comma
            parsed_string[i] = 'hey,'
        i += 1
    return ' '.join(parsed_string)

sentence = 'hey how are you'
print(format(sentence))

输出:

hey, how are you

答案 1 :(得分:0)

在研究领域中,在给定字符串中添加适当的标点符号的任务称为“ punctuation restoration”。 (不知道为什么这个问题引起了如此多的反对,标点恢复是一个有效的研究领域。)

用于标点恢复的Python程序: