数据规范化

时间:2015-10-08 14:31:57

标签: python normalization

我有一个代码来规范化从xls导入的数据。这是一个s跟随

<?php
     $departments = $_POST['departments'];
?>

<html>
    <head></head>
    <body>
        <form action="home.php" method="post">
            <?php
             for($i = 0; $i < 4; $i++)
             {
                 include("include_sorts.php");
             }
            ?>
        <button type="submit">Submit</button>
        </form>
    </body>
</html>

这是一个相当简单的代码,其中Xt和Tt是数据集。 Xt的尺寸是(750,8),其中750是行数,8是列数,Tt的尺寸是(750,2)与上面的行和列对应的数字。根据该特定列中的最大值,对每列的数据进行标准化。

现在我想创建一个函数并创建一个循环,这样我就不想像我的例子那样一遍又一遍地重复相同的代码。我怎么做?我是编程新手,我不熟悉循环概念。谢谢你提前

我希望有类似的东西:

import numpy as np
Xt, Tt = XLSImport('AI_sample.xlsx')

# calculate the maximum values
valX1_max = np.max((Xt)[0])
valX2_max = np.max((Xt)[1])
valX3_max = np.max((Xt)[2])
valX4_max = np.max((Xt)[3])
valX5_max = np.max((Xt)[4])
valX6_max = np.max((Xt)[5])
valX7_max = np.max((Xt)[6]) 
valX8_max = np.max((Xt)[7])

valT1_max = np.max((Tt)[0])
valT2_max = np.max((Tt)[1])

print valX1_max, valX2_max, valX3_max, valX4_max, valX5_max, valX6_max, valX7_max, valX8_max, valT1_max, valT2_max


# normalize data
Xt[0] /= valX1_max
Xt[1] /= valX2_max
Xt[2] /= valX3_max
Xt[3] /= valX4_max
Xt[4] /= valX5_max
Xt[5] /= valX6_max
Xt[6] /= valX7_max
Xt[7] /= valX8_max
Tt[0] /= valT1_max
Tt[1] /= valT2_max

print Xt, Tt

我应该怎么做?

1 个答案:

答案 0 :(得分:1)

我建议使用python中提供的众多优秀数据处理库之一。熊猫似乎特别容易使用。您需要的大多数东西可能已经在那里编程了!

你可以考虑miniconda。它是一个python发行版,可以很容易地安装复杂的依赖项,比如numpy(pandas所依赖的)

一旦你运行python + pandas,进行规范化就像馅饼一样简单。请参阅this answer以获得更好的解释!!

祝你好运,欢迎来到现有的python编程世界:)

编辑:在重读了你的问题之后,我想现在你已经跑了。因此,使用pip安装pandas会更容易。