我正在使用来自Survey Monkey的CSV数据。问题是他们使用的列名对于大多数数据库CSV数据导入例程来说太长了。从字面上看,列名是您在调查中提出的问题。因此,对于数据库列名称,可能需要一些时间才能将其缩小到64个字符。 python例程将问题缩小到几个单词和/或字符会是什么样的?我不能只做一些像移除元音的事情,因为在大多数情况下这仍然太长。想法?
答案 0 :(得分:0)
如果你只需要标题是唯一的并且少于64(你使用postgres btw吗?)那么只需使用哈希。
from hashlib import md5
columns = ['reallylongcolumname1', 'reallylongcolumname2']
out = {}
for c in columns:
h = md5(c).hexdigest()
# Use 'h' as your new column header!
out.update({c : h})
保存字典" out"某处你可以稍后解密。