我有没有标题的Hive数据库表csv提取。我将csv加载为dataframe,它没有列名。由于列的长度将根据数据表而变化,如何根据列的长度分配col名称?
我知道为固定列长分配列的方法。
>>> df1 = pd.read_csv('/home/j/HiveOP_06June_1.csv', header = None)
>>> df1.columns = ['Col1','Col2', 'Col3']
>>> df1
Col1 Col2 Col3
0 XPRN A 2019-12-16 00:00:00
如果我要导出具有25列的数据表,那我该如何即时命名所有col?
答案 0 :(得分:2)
我会这样:
names = [('Col' + str(i)) for i in range(1, 26)]
df1 = pd.read_csv('/home/j/HiveOP_06June_1.csv', names=names, header=None)
当然,您可以使用每个列的名称手动命名列。