Question

导入.csv时，我将结果另存为pandas DataFrame，如下所示：

csv_dataframe= pd.DataFrame(pd.read_csv(r'filepath.csv', delimiter=';', encoding='iso-8859-1', decimal=',', low_memory=False))

但是，当我调用包含数字和字母的特定列时，它会忽略某些字符或添加其他字符。例如，在“ A”列中，有与此类似的元素：

'ABC123456789'
'123456789'
'1234567'

当我打电话时：

csv_dataframe['A']

结果是：

'ABC123456789'
'1234567342'
'3456475'

因此，某些值是正确的，但在另一些值中，它会更改值，添加或删除元素。在某些情况下，它甚至会改变其长度。

例如，是否存在某种形式的更改其他程序读取.csv文件中的.csv文件的方式？也就是说，.csv文件中是否有一个选项可以掩盖打开时不明显的值？或者，在调用文件/函数时我是否犯了任何错误？

非常感谢您。

Answer 1

尝试删除“ pd.DataFrame（）”

pd.read_csv已经创建了一个数据框

这应该有效：

csv_dataframe= pd.read_csv(r'filepath.csv', delimiter=';', encoding='iso-8859-1', decimal=',', low_memory=False)

它可能会解决您的问题，除此之外，我敢打赌该问题在CSV中。