如何从UCI机器学习存储库导入.data和.lisp文件?

时间:2019-03-09 22:27:23

标签: python pandas

这是我要导入的数据的link。这些文件是.data,.names和.lisp。如何将它们作为数据框导入Python?我尝试过:

df = pd.read_table('http://archive.ics.uci.edu/ml/machine-learning-databases/credit-screening/crx.data', sep='')

pd.read_csv()一样,但由于文件不是CSV格式,因此无法正常工作。感谢您的帮助!

1 个答案:

答案 0 :(得分:1)

使用read_table时需要定义分隔符。在这种情况下,您的列用,分隔。您还应该设置header=None,因为data file不包含标题(列名)。尽管read_table可能有效,但现在已弃用它,因此您可以改用read_csv

import pandas as pd

df = pd.read_csv('http://archive.ics.uci.edu/ml/machine-learning-databases/credit-screening/crx.data', sep=',', header=None)

print(df)

     0      1       2  3  4   5   6       7  8  9   10 11 12     13     14 15
0    b  30.83   0.000  u  g   w   v   1.250  t  t   1  f  g  00202      0  +
1    a  58.67   4.460  u  g   q   h   3.040  t  t   6  f  g  00043    560  +
2    a  24.50   0.500  u  g   q   h   1.500  t  f   0  f  g  00280    824  +
3    b  27.83   1.540  u  g   w   v   3.750  t  t   5  t  g  00100      3  +
4    b  20.17   5.625  u  g   w   v   1.710  t  f   0  f  s  00120      0  +
5    b  32.08   4.000  u  g   m   v   2.500  t  f   0  t  g  00360      0  +
6    b  33.17   1.040  u  g   r   h   6.500  t  f   0  t  g  00164  31285  +
7    a  22.92  11.585  u  g  cc   v   0.040  t  f   0  f  g  00080   1349  +
...
[690 rows x 16 columns]