我有一个sas7bdat格式的大型SAS数据集,我正在使用Pandas和SQLite3将其转换为.db文件,代码如下。
df = pd.read_sas('file.sas7bdat')
con = sqlite3.connect('file.db')
df.to_sql(name='file', con=con, if_exists = 'replace', index=False)'
转换工作正常但是该过程在它看到字符串变量(字符串之前和之后)的任何地方都添加了额外的字符。因此,如果它看到(B010),它会将其转换为(b' B010')。我后来使用熊猫剥去这样的角色 -
df['column'].map(lambda x: str(x)[2:-1])
但是有太多列有这样的错误,所以有没有办法在转换过程中解决这个问题?