这是我要导入的数据的link。这些文件是.data,.names和.lisp。如何将它们作为数据框导入Python?我尝试过:
df = pd.read_table('http://archive.ics.uci.edu/ml/machine-learning-databases/credit-screening/crx.data', sep='')
与pd.read_csv()
一样,但由于文件不是CSV格式,因此无法正常工作。感谢您的帮助!
答案 0 :(得分:1)
使用read_table
时需要定义分隔符。在这种情况下,您的列用,
分隔。您还应该设置header=None
,因为data file不包含标题(列名)。尽管read_table
可能有效,但现在已弃用它,因此您可以改用read_csv
。
import pandas as pd
df = pd.read_csv('http://archive.ics.uci.edu/ml/machine-learning-databases/credit-screening/crx.data', sep=',', header=None)
print(df)
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
0 b 30.83 0.000 u g w v 1.250 t t 1 f g 00202 0 +
1 a 58.67 4.460 u g q h 3.040 t t 6 f g 00043 560 +
2 a 24.50 0.500 u g q h 1.500 t f 0 f g 00280 824 +
3 b 27.83 1.540 u g w v 3.750 t t 5 t g 00100 3 +
4 b 20.17 5.625 u g w v 1.710 t f 0 f s 00120 0 +
5 b 32.08 4.000 u g m v 2.500 t f 0 t g 00360 0 +
6 b 33.17 1.040 u g r h 6.500 t f 0 t g 00164 31285 +
7 a 22.92 11.585 u g cc v 0.040 t f 0 f g 00080 1349 +
...
[690 rows x 16 columns]