所以我对如何前进有疑问。我有一个类似的csv文件 [名称,日期/时间,消息,主要,次要,音调,危机,自杀,海报,主题标签]
我只需要对名称进行匿名处理,然后我就使用了哈希来实现这一点。我能够隔离名称并对它们进行哈希处理,但我真的不知道如何将其追加并创建一个新的csv文件,其中包含我目前拥有的新的匿名名称(但使用原始数据):
import hashlib
with open("example.csv") as f:
for ex in f:
list = ex.split(",")
name = list[0]
# prints the isolated names
hashObject = hashlib.md5(name.encode())
print hashObject.hexdigest()
答案 0 :(得分:0)
以下代码应该有效,它将用散列值替换每一行的第一项,并将结果写入新文件:
import hashlib
with open('example.csv') as fin, open('output.csv', 'w') as fout:
for ex in fin:
items = ex.split(',')
items[0] = hashlib.md5(items[0].encode()).hexdigest()
fout.write(','.join(items))