我的原始CSV文件在每个块中都有float64值,但是在我使用pd.csv()读取文件后,它返回了一个空白表。我试图设置定界符和函数的编码,但它根本没有帮助。 CSV文件是由软件自动生成的,我无法检查设置的设置。 有什么办法可以将文件读取到具有正确值的数据帧?
myH2OFrame.toTwoDimTable(0, 20, false)
我将CSV文件简化为
>>> pd.read_csv('./HISTORY_LOG_05-31-2018.CSV')
D Unnamed: 1 Unnamed: 2 ... Unnamed: 108 Unnamed: 109 Unnamed: 110
0 NaN NaN NaN ... NaN NaN NaN
1 NaN NaN NaN ... NaN NaN NaN
2 NaN NaN NaN ... NaN NaN NaN
3 NaN NaN NaN ... NaN NaN NaN
4 NaN NaN NaN ... NaN NaN NaN
5 NaN NaN NaN ... NaN NaN NaN
[6 rows x 111 columns]
我仍然得到如下结果:
A,B
0.000,0.000
0.000,0.000
答案 0 :(得分:0)
与您提供的示例输入完美配合
还显示了示例输入
还显示了Python和熊猫的版本
~ $ python
Python 3.6.4 |Anaconda custom (64-bit)| (default, Jan 16 2018, 18:10:19)
[GCC 7.2.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import pandas as pd
>>> pd.read_csv('sample.csv')
A B
0 0.0 0.0
1 0.0 0.0
>>> pd.__version__
'0.22.0'
>>> exit()
~ $ cat sample.csv
A, B
0.000, 0.000
0.000, 0.000
答案 1 :(得分:0)
因此,我也遇到了同样的问题,因此找到了答案。我的编码错误,因此无法正确读取文本。我在Visual Studio Code中将其打开,发现编码为UTF-16 LE。我的输出来自powershell,所以您的输出可能也是如此,您可能只需要指定输出编码或更改熊猫的编码即可。
pd.read_csv("ADSearch.txt",encoding='UTF-16 LE')
Empty DataFrame
Columns: [lastname, firstname, username, site, email, Unnamed: 5, False, True]
Index: []