我有一个文本文件,需要从中找到每个句子的平均单词数和每个段落的平均句子数,其中一个句子是单词后跟一个句号,逗号或感叹号,然后必须在其后加上引号(因此句子是引号或口头话的结尾)或空白(空格,制表符或新的-行字符),并且段落是任意数量的句子,后跟空白行或文本结尾,而无需使用正则表达式。
我创建了一个单词列表,即我的问题所说的[".", ",", "!", "\n", "\t", " "]
,然后遍历整个文本文件。
with open("/Users/abhishekabhishek/downloads/l.txt") as f:
text_lis = f.read()
# print(text_lis)
sentence_count = 0
ens_sentence = [".", ",", "!", "\n", "\t", " "]
for word in ens_sentence:
if word in text_lis:
sentence_count += 1
#print(sentence_count)
# sentence_count gave me the wrong output so I tried splitting it
# using text_lis.split(".") so that I can count the sentences
s = text_lis.split(".")
# the for average number of words per sentence
char_len = 0
for line in s:
words = line.split(" ")
for word in words:
char_len += len(word.split)
average_number_of words = char_len/len(words)
实际输出必须是该段落中句子的平均数量和每个句子的平均单词数。我尝试的方法给我输出了错误的信息,因为文件中某些单词还使用了标点符号,例如.'
适用于前任博士等,当我使用text_lis.split()
时,它也将这些单词视为句子的结尾。
这是示例文本 我很想尝试或听听您的应用可以产生的示例音频。我不想购买,因为我已经购买了太多的应用程序,这些应用程序说它们可以执行某些操作,但无法交付。
可以将转换后的文本添加到音频样本中吗?我希望看到最终结果。
谢谢!
作者。