我刚开始使用Natural Language Toolkit(NLTK)作为我的工程学院项目的一部分。任何人都可以告诉我如何阅读输入段落文本和
1)将其分解为文本成分,即在给定段落中句子数,单词数,字符数和多音节或复杂单词数
和
2)同时打印以上确定的值
答案 0 :(得分:0)
输入段落来自何处?文件?安慰?这比喋喋不休更像是一个python问题。
其余的,请查看nltk.tokenize模块&使用nltk.probability.FreqDist。
答案 1 :(得分:0)
import curses
from curses.ascii import isdigit
import nltk
from nltk.corpus import cmudict
d = cmudict.dict()
def nsyl(word):
return [len(list(y for y in x if isdigit(y[-1]))) for x in d[word.lower()]]
这应该能够为每个单词提供一个音节计数。希望这会有所帮助。