合并后的Pandas Dataframe Correlation

时间:2017-10-02 17:52:07

标签: python pandas dataframe

<div class="row-content col-sm-8">
        <div class="card">
            <h3 class="card-header card-warning" style="width: 100%">Featured</h3>
            <form class="col-sm-12 row">
                <div class="col-xs-12 col-sm-3 align-items-center">
                    <label><strong>Number of Guests</strong></label>
                </div>
                <div class="col-sm-9 col-md-9 input-group">
                    <label class="radio-inline" style="padding-left:">
                                                <input type="radio" name="inlineRadioOptions" id="inlineRadio1" value="option1"> 1
                                            </label>
                    <label class="radio-inline">
                                                <input type="radio" name="inlineRadioOptions" id="inlineRadio2" value="option2"> 2
                                            </label>
                    <label class="radio-inline">
                                                <input type="radio" name="inlineRadioOptions" id="inlineRadio3" value="option3"> 3
                                            </label>
                    <label class="radio-inline">
                                                <input type="radio" name="inlineRadioOptions" id="inlineRadio1" value="option1"> 4
                                            </label>
                    <label class="radio-inline">
                                                <input type="radio" name="inlineRadioOptions" id="inlineRadio2" value="option2"> 5
                                            </label>
                    <label class="radio-inline">
                                                <input type="radio" name="inlineRadioOptions" id="inlineRadio3" value="option3"> 6
                                            </label>
                </div>
                <div class="col-xs-12 col-sm-3 align-items-center">
                    <p style="padding: 10px"></p>
                    <p><strong>Date and Time</strong></p>
                </div>
                    <div class="col-sm-9 col-md-9 input-group align-items-center row">
                        <div class="col-sm-6">
                            <div class="input-group">
                                <span class="input-group-addon"><i class="fa fa-calendar-o fa-fw"></i></span></span>
                                <input type="text" class="form-control" aria-label="Date" placeholder="Date">
                            </div>
                        </div>
                        <div class="col-sm-6">
                            <div class="input-group">
                                <span class="input-group-addon"><i class="fa fa-clock-o fa-fw"></i></span></span>
                                <input type="text" class="form-control" aria-label="Text input with radio button" placeholder="Time">
                            </div>
                        </div>
                    </div>
                <div class="col-sm-3">
                </div>
                <div class="col col-offset">
                    <a class="btn btn-primary" href="#">Reserve</a>
                </div>

            </form>
        </div>

    </div>

基本上我从我们的数据库中获得了2个数据帧,并试图找到参数之间的相关性。当我打印df时,它显示301条记录(行)和177列。我期望从df.corr()的结果中得到177x177表,但发现它只有86x86表。发现所有86个参数都来自df1(合并前)。当我通过选择最后80列只包含来自df1的5列来创建新数据帧时,我发现df.corr()结果出现在5x5表中,其中只包含来自df1的参数。我在这做错了什么?谢谢!

UPDATE,它看起来问题不是关于可转动,合并或NaN问题,但是corr()不处理查询中的某些数据。 df2显示尺寸为81245x3并打印了标题。我希望corr()函数输出3x3,而得到一个空数据帧......有什么建议吗?

UPDATE-2,我意识到问题是由于数据集中的混合类型。添加如下所示的行后,它工作正常:         df2 [&#39; DATA&#39;] = df2 [&#39; DATA&#39;]。apply(pd.to_numeric,args =(&#39; coerce&#39;,))

1 个答案:

答案 0 :(得分:0)

您已完成内部合并。这意味着合并的DataFrame将只包含df1和df2中的行。此外,由于您尚未指定数据框应合并的列,因此仅当所有列都匹配时,Pandas才会合并行。

尝试指定要在索引上匹配或匹配的列名。

请查看此处的文档:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.merge.html