在python中压缩文本的代码是什么?

时间:2016-02-29 09:43:03

标签: python compression

开发一个程序,检查没有任何标点符号的句子,并查找并识别句子中出现的每个单词的位置。因此,系统不应区分大小写:text,Text,TEXT应视为同一个单词。该程序必须能够为该列表中的单词创建一个位置列表,然后才能将列表保存为单个文件或单独的文件。

1 个答案:

答案 0 :(得分:-1)

假设句子中的单词间隔为一个空格,则以下内容应起作用:

import pickle

words = sentence.lower().split()
pos = 0
result = []
for w in words:
    result.append((w, pos))
    pos += len(w) + 1
with open('filename','w') as o:
    o.write(pickle.dumps(result))