在python中将单词及其缩写聚类在一起

时间:2017-07-27 11:38:56

标签: python text text-analysis abbreviation

我在Python中有一个字符串列表。

例如,

['FD为5000','RD','固定存款为10000','RD为1000','经常性存款为1000']

输入不必相同。列表中的字符串可以是任何顺序,列表可以是任意长度。

我想将带有单词及其缩写的字符串放在单独的列表中。

预期产出: {['FD for 5000','Fixed Deposit for 10000'], ['RD','RD为1000','经常性存款为1000'}}

我正在尝试将用户输入的评论集中在一起。一些用户可以以缩写形式输入文本,而其他用户可以以完整形式输入文本。因此,为了将类似的评论组合在一起,我需要一种通用的方式。

希望任何可能的解决方案。

1 个答案:

答案 0 :(得分:0)

有很多方法可以做到这一点。例如:

  1. 列表中的所有奇数元素都是缩写。你可以使用列表理解来获取它们:

    [a for (a,b) in zip(a,range(10)) if b % 2 == 1]
    

    同样,非缩写:

    [a for (a,b) in zip(a,range(10)) if b % 2 == 0]
    
  2. list[start:end:step]step = 2一起使用。