查找段落中的平均单词和句子数

时间:2019-04-29 04:58:18

标签: python-3.x dictionary

我有一个文本文件,需要从中找到每个句子的平均单词数每个段落的平均句子数,其中一个句子是单词后跟一个句号,逗号或感叹号,然后必须在其后加上引号(因此句子是引号或口头话的结尾)或空白(空格,制表符或新的-行字符),并且段落是任意数量的句子,后跟空白行或文本结尾,而无需使用正则表达式。

我创建了一个单词列表,即我的问题所说的[".", ",", "!", "\n", "\t", " "],然后遍历整个文本文件。

 with open("/Users/abhishekabhishek/downloads/l.txt") as f:
     text_lis = f.read()
# print(text_lis)
sentence_count = 0
ens_sentence = [".", ",", "!", "\n", "\t", " "]
for word in ens_sentence:
    if word in text_lis:
       sentence_count += 1
#print(sentence_count)
# sentence_count gave me the wrong output so I tried splitting it 
# using text_lis.split(".") so that I can count the sentences            
s = text_lis.split(".")
# the for average number of words per sentence 
char_len = 0
for line in s:
  words = line.split(" ")
     for word in words:
           char_len += len(word.split)
average_number_of words = char_len/len(words)

实际输出必须是该段落中句子的平均数量和每个句子的平均单词数。我尝试的方法给我输出了错误的信息,因为文件中某些单词还使用了标点符号,例如.'适用于前任博士等,当我使用text_lis.split()时,它也将这些单词视为句子的结尾。

这是示例文本 我很想尝试或听听您的应用可以产生的示例音频。我不想购买,因为我已经购买了太多的应用程序,这些应用程序说它们可以执行某些操作,但无法交付。

可以将转换后的文本添加到音频样本中吗?我希望看到最终结果。

谢谢!

作者。

0 个答案:

没有答案