我正在使用34种功能进行语音情感识别的研究,但是我尝试使用PCA找到最重要的功能。
我发现了主要成分的价值以及与之相关的情感。我尝试使用inverse_transform,但是输出与我的数据帧不同。
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
import sys
def pca():
df = pd.read_excel ('/Users/MaxEdelman/Documents/meanDf.xlsx')
features = df.columns[1:35]
x = df.iloc[:, 1:35].values
y = df.loc[:, ['emotion']].values
x = StandardScaler().fit_transform(x)
pd.DataFrame(data=x, columns=features).head()
pca = PCA(n_components=2)
principalComponents = pca.fit_transform(x)
principalDf = pd.DataFrame ( data=principalComponents, columns=
['principal component 1', 'principal component 2'])
finalDf = pd.concat([principalDf, df[['emotion']]], axis=1 )
我如何确定这些成分从何而来?