我有两栏。第一列包含与薪水相关的数据,第二列包含与员工的house_rent相关的数据。现在使用python我想找到两者之间的相关性。 Python中有某种方法可以可视化相关性:
Salary house_rent
10000 50
10000 50
3000 465
此任务的重点是找到员工的薪水和房租之间的相关程度。例如。有些员工的薪水可能很高,而房租却很少,另一些员工的薪水却很高,房租也很大。请注意,两个人的薪水和房租相同可能是很可能的情况。可以在python中将其可视化吗?
答案 0 :(得分:1)
您可以使用sklearn.linear_model.LinearRegression绘制线性回归线:
https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html
您还可以使用matplotlib中的pyplot.matshow()构建关联矩阵:
import matplotlib.pyplot as plt
plt.matshow(dataframe.corr())
plt.show()
答案 1 :(得分:1)
如前所述,您可以使用AdapterMoreSectionHotTrendingNews
中存在的 @Override
public void onBindViewHolder(RecyclerView.ViewHolder holder, final int position) {
final SectionMoreHotTrendingNewsViewHolder sectionMoreHotTrendingNewsViewHolder = (SectionMoreHotTrendingNewsViewHolder) holder;
ModelSectionHotTrendingNews modelSectionHotTrendingNewsX = modelSectionHotTrendingNews.get(position);
//Set
sectionMoreHotTrendingNewsViewHolder.TVSectionTitle.setText(modelSectionHotTrendingNewsX.getHeaderTitle());
// here you have to change your ArrayList to ArrayList<ModelSingleHotTrendingNews>
ArrayList<ModelSingleHotTrendingNews> singleSectionItems = modelSectionHotTrendingNewsX.getAllItemsInSection();
// reset of your codes here.
方法来获取相关性。
可视化的更好方法是使用corr
库而不是pandas
。
seaborn
有关更多详细信息,请参见https://seaborn.pydata.org/generated/seaborn.pairplot.html 和 https://towardsdatascience.com/visualizing-data-with-pair-plots-in-python-f228cf529166