如何计算csv文件中包含的单词的后缀?

时间:2015-01-26 11:52:03

标签: python csv

我之前已经找到了一种计算前缀的方法,如下所示,所以有没有类似于此的方法,这是显而易见的,我完全错过了它?

for i in range (0, len(hardprefix)):
    if len(word) > len(hardprefix[i]):
            if word.startswith(hardprefix[i]):
                hardprefixcount += 1
                break

我需要此代码才能使用文件的第一列并计算在这些单词中找到的一组后缀的数量

这是我到目前为止所拥有的

for i in range (0, len(easysuffix)):
    if len (word) > len(easysuffix[i]):
            if word.endswith(easysuffix[i]):
                easysuffixcount += 1
                break

下面是来自csv文件的数据样本,数组使用下面的后缀

on  1
only    4
our 1
own 1
part    7
piece   4
pieces  4
place   1
pressed 1
riot    1
september   1
shape   3

hardsuffix = ['ism']
easysuffix = ['ity', 'esome', 'ece']

1 个答案:

答案 0 :(得分:0)

您的输入文件是制表符分隔的CSV,因此您可以使用csv模块进行处理。

import csv

suffixes = ['ity', 'esome', 'ece']

with open('input.csv') as words:
    suffix_count = 0
    reader = csv.reader(words, delimiter='\t')
    for word, _ in reader:
        if any(word.endswith(suffix) for suffix in suffixes):
            suffix_count += 1

print "Found {} suffix(es)".format(suffix_count)