在Python上,使用Pandas库,我正在尝试使用scatter_matrix
生成DataFrame的散点图,如下所示:
scatter_matrix(df, alpha=0.5, figsize=(14,14), diagonal='kde')
该程序需要很长时间才能运行并最终崩溃,可能是因为有太多(26)列,并且生成的图像会很大。更虚空,我注意到我能够很好地渲染13个变量。这样,一种解决方案是生成4个图,一个用于生成的散射矩阵的每个象限,即范围[[0,0],[13,13]], [[13,0],[26,13]], [[0,13],[13,26]], [[13,13],[26,26]]
。请注意,这些不是指源DataFrame上的范围,而是指我正在渲染的目标散射矩阵。有可能吗?
答案 0 :(得分:1)
我找不到任何正式方法,所以我修改了//Dockerfile on AWS EC2
FROM lambdalinux/baseimage-amzn:2016.09-000
RUN curl --silent --location https://rpm.nodesource.com/setup_4.x | bash -
RUN yum install -y tar nodejs
ADD ./myApp.tar.gz /opt/
EXPOSE 80
ENV ROOT_URL http://example.com
ENV MONGO_URL "mongodb://username:pass..."
ENV PORT 80
# Install nodejs modules
WORKDIR /opt/bundle/
RUN npm install fibers
RUN npm install underscore
RUN npm install source-map-support
RUN npm install semver
# Start the app
CMD node ./main.js
实现以接收2个额外的参数,scatter_matrix
和cols
,这些是带有标签的数组想要比较:
rows
我很粗心地修改了这段代码,所以它可能已被破坏但满足了我的需求。
答案 1 :(得分:0)
4个象限将是:
mid_ind = len(df.index)//2
mid_col = len(df.columns)//2
df.iloc[:mid_ind,:mid_col]
df.iloc[mid_ind:,:mid_col]
df.iloc[mid_ind:,mid_col:]
df.iloc[:mid_ind,mid_col:]