Python'utf-8'编解码器无法解码字节0xe0

时间:2017-03-30 12:08:00

标签: python csv

import re

dictionary = dict()

for line in open('Group14.csv', encoding="utf8"):
    line = line.strip()

    date = re.findall('(\w+\s\w+\s\d+)\s\d+\S\d+\S\d+\s\S+\s(\d+)', line)
    tweet = re.findall(',(.*)', line)
    #print(date[0], tweet[0])
    for key, value in dictionary.items():
        if tweet[0] in dictionary.values():
            dictionary[date[0]] += 1
        else:
            dictionary[date[0]] = tweet[0]
print(dictionary)

我想从一个Group14.csv中读取数据。 删除多余的空格。 对于Group14.csv中的第二列,我想循环遍历它以运行清除条件,如果为真:将打印具有相邻coloumn 1单元格的单元格<&gt ;.如果为假:跳过线......

然后我想将两列清理后的数据输出到另一个csv

注意:第一列是TWITTER日期,第二列是TWEET

0 个答案:

没有答案