如何查找文本功能并进行打印?

时间:2011-02-15 16:30:06

标签: python nltk

我刚开始使用Natural Language Toolkit(NLTK)作为我的工程学院项目的一部分。任何人都可以告诉我如何阅读输入段落文本

1)将其分解为文本成分,即在给定段落中句子数,单词数,字符数和多音节或复杂单词数

2)同时打印以上确定的值

2 个答案:

答案 0 :(得分:0)

输入段落来自何处?文件?安慰?这比喋喋不休更像是一个python问题。

其余的,请查看nltk.tokenize模块&使用nltk.probability.FreqDist。

答案 1 :(得分:0)

关于NLTK google group

的讨论
import curses 
from curses.ascii import isdigit 
import nltk 
from nltk.corpus import cmudict

d = cmudict.dict() 

def nsyl(word): 
  return [len(list(y for y in x if isdigit(y[-1]))) for x in d[word.lower()]] 

这应该能够为每个单词提供一个音节计数。希望这会有所帮助。