我可以使用以下命令加载.arff文件。但我无法从对象中提取数据并将对象转换为数据帧格式。我需要这个在这个数据帧上应用机器学习算法。
命令: -
import arff
dataset = pd.DataFrame(arff.load(open('Training Dataset.arff')))
print(dataset)
请帮我将数据从这里转换为数据帧。
答案 0 :(得分:1)
import numpy as np
import pandas as pd
from scipy.io.arff import loadarff
raw_data = loadarff('Training Dataset.arff')
df_data = pd.DataFrame(raw_data[0])
试试这个。希望它有所帮助
答案 1 :(得分:0)
from scipy.io.arff import loadarff
import pandas as pd
data = arff.loadarff('breast-cancer.arff')
df = pd.DataFrame(data[0])
类似于上面的回答,但不需要导入 numpy