导入.csv时,我将结果另存为pandas DataFrame,如下所示:
csv_dataframe= pd.DataFrame(pd.read_csv(r'filepath.csv', delimiter=';', encoding='iso-8859-1', decimal=',', low_memory=False))
但是,当我调用包含数字和字母的特定列时,它会忽略某些字符或添加其他字符。例如,在“ A”列中,有与此类似的元素:
'ABC123456789'
'123456789'
'1234567'
当我打电话时:
csv_dataframe['A']
结果是:
'ABC123456789'
'1234567342'
'3456475'
因此,某些值是正确的,但在另一些值中,它会更改值,添加或删除元素。在某些情况下,它甚至会改变其长度。
例如,是否存在某种形式的更改其他程序读取.csv文件中的.csv文件的方式?也就是说,.csv文件中是否有一个选项可以掩盖打开时不明显的值?或者,在调用文件/函数时我是否犯了任何错误?
非常感谢您。
答案 0 :(得分:0)
尝试删除“ pd.DataFrame()”
pd.read_csv已经创建了一个数据框
这应该有效:
csv_dataframe= pd.read_csv(r'filepath.csv', delimiter=';', encoding='iso-8859-1', decimal=',', low_memory=False)
它可能会解决您的问题,除此之外,我敢打赌该问题在CSV中。