可视化python中两列之间的相关性

时间:2019-10-11 04:01:12

标签: python python-3.x matplotlib machine-learning statistics

我有两栏。第一列包含与薪水相关的数据,第二列包含与员工的house_rent相关的数据。现在使用python我想找到两者之间的相关性。 Python中有某种方法可以可视化相关性:

Salary   house_rent
10000    50
10000    50
3000     465

此任务的重点是找到员工的薪水和房租之间的相关程度。例如。有些员工的薪水可能很高,而房租却很少,另一些员工的薪水却很高,房租也很大。请注意,两个人的薪水和房租相同可能是很可能的情况。可以在python中将其可视化吗?

2 个答案:

答案 0 :(得分:1)

您可以使用sklearn.linear_model.LinearRegression绘制线性回归线:

https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html

您还可以使用matplotlib中的pyplot.matshow()构建关联矩阵:

import matplotlib.pyplot as plt

plt.matshow(dataframe.corr())
plt.show()

答案 1 :(得分:1)

如前所述,您可以使用AdapterMoreSectionHotTrendingNews中存在的 @Override public void onBindViewHolder(RecyclerView.ViewHolder holder, final int position) { final SectionMoreHotTrendingNewsViewHolder sectionMoreHotTrendingNewsViewHolder = (SectionMoreHotTrendingNewsViewHolder) holder; ModelSectionHotTrendingNews modelSectionHotTrendingNewsX = modelSectionHotTrendingNews.get(position); //Set sectionMoreHotTrendingNewsViewHolder.TVSectionTitle.setText(modelSectionHotTrendingNewsX.getHeaderTitle()); // here you have to change your ArrayList to ArrayList<ModelSingleHotTrendingNews> ArrayList<ModelSingleHotTrendingNews> singleSectionItems = modelSectionHotTrendingNewsX.getAllItemsInSection(); // reset of your codes here. 方法来获取相关性。 可视化的更好方法是使用corr库而不是pandas

seaborn

有关更多详细信息,请参见https://seaborn.pydata.org/generated/seaborn.pairplot.htmlhttps://towardsdatascience.com/visualizing-data-with-pair-plots-in-python-f228cf529166