我正在尝试运行以下脚本以将其添加到文件左侧的列中;但是它一直在给我
valueError: header must be integer or list of integers
下面是我的代码:
import pandas as pd
import numpy as np
read_file = pd.read_csv("/home/ex.csv",header='true')
df=pd.DataFrame(read_file)
def add_col(x):
df.insert(loc=0, column='Creation_DT', value=pd.to_datetime('today'))
df.insert(loc=1, column='Creation_By', value="Sean")
df.to_parquet("/home/sample.parquet")
add_col(df)
有什么方法可以将creation_dt列设置为字符串?
答案 0 :(得分:0)
根据pandas docs header
是用作列名的行号,以及数据的开头,并且必须为int或int列表。因此,您必须将header=0
传递给read_csv
方法。
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
此外,pandas会自动从读取的文件创建数据框,您无需另外进行操作。只需使用
df = pd.read_csv("/home/ex.csv", header=0)
答案 1 :(得分:0)
您可以尝试:
import pandas as pd
import numpy as np
read_file = pd.read_csv("/home/ex.csv")
df=pd.DataFrame(read_file)
def add_col(x):
df.insert(loc=0, column='Creation_DT', value=str(pd.to_datetime('today')))
df.insert(loc=1, column='Creation_By', value="Sean")
df.to_parquet("/home/sample.parquet")
add_col(df)