熊猫“ read_csv”函数为我的表中的所有块返回NAN

时间:2018-06-21 18:04:53

标签: python pandas csv

我的原始CSV文件在每个块中都有float64值,但是在我使用pd.csv()读取文件后,它返回了一个空白表。我试图设置定界符和函数的编码,但它根本没有帮助。 CSV文件是由软件自动生成的,我无法检查设置的设置。 有什么办法可以将文件读取到具有正确值的数据帧?

myH2OFrame.toTwoDimTable(0, 20, false)

我将CSV文件简化为

>>> pd.read_csv('./HISTORY_LOG_05-31-2018.CSV')
D  Unnamed: 1  Unnamed: 2      ...       Unnamed: 108  Unnamed: 109  Unnamed: 110
0 NaN         NaN         NaN      ...                NaN           NaN           NaN
1 NaN         NaN         NaN      ...                NaN           NaN           NaN
2 NaN         NaN         NaN      ...                NaN           NaN           NaN
3 NaN         NaN         NaN      ...                NaN           NaN           NaN
4 NaN         NaN         NaN      ...                NaN           NaN           NaN
5 NaN         NaN         NaN      ...                NaN           NaN           NaN

[6 rows x 111 columns]

我仍然得到如下结果:

A,B
0.000,0.000

0.000,0.000

2 个答案:

答案 0 :(得分:0)

与您提供的示例输入完美配合

还显示了示例输入

还显示了Python和熊猫的版本

~ $ python
Python 3.6.4 |Anaconda custom (64-bit)| (default, Jan 16 2018, 18:10:19) 
[GCC 7.2.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import pandas as pd
>>> pd.read_csv('sample.csv')
     A    B
0  0.0  0.0
1  0.0  0.0
>>> pd.__version__
'0.22.0'
>>> exit()
~ $ cat sample.csv 
A, B
0.000, 0.000
0.000, 0.000

答案 1 :(得分:0)

因此,我也遇到了同样的问题,因此找到了答案。我的编码错误,因此无法正确读取文本。我在Visual Studio Code中将其打开,发现编码为UTF-16 LE。我的输出来自powershell,所以您的输出可能也是如此,您可能只需要指定输出编码或更改熊猫的编码即可。

pd.read_csv("ADSearch.txt",encoding='UTF-16 LE')
Empty DataFrame
Columns: [lastname, firstname, username, site, email, Unnamed: 5, False, True]
Index: []