在Python中使用关系值预测值

时间:2017-08-02 16:48:49

标签: python python-3.x csv

我编写了一个小脚本,用于分析.csv文件,并将价格列和平方英尺列转换为2个列表。

我想找到一种获取与两个列表相关的单个值的方法。我需要价值来预测平方英尺金额的未来价格。有没有办法做到这一点。我听说过linreg,但我不知道如何使用它。另外,在我的代码中我获得了一个值,但它是两个值,我做错了什么?我该怎么做?

filename = 'C:/Users/saeed/Downloads/Sacramentorealestatetransactions.csv'

df = pandas.read_csv(filename)

print(tabulate(df, headers='keys', tablefmt='psql'))

with open(filename) as i:
    sqft = [int(row["sq__ft"]) for row in DictReader(i)]


with open(filename) as i:
    price = [int(row["price"]) for row in DictReader(i)]

df[df['sq__ft'] != 0]

print(sqft)
print(price)

from scipy import stats
corr = stats.pearsonr(sqft, price)

print(corr)

z = np.arctanh(corr[0])

print(z)

sigma = (1/((len(df.index)-3)**0.5))

print(sigma)

cint = z + np.array([-1, 1]) * sigma * stats.norm.ppf((1+0.95)/2)

fnl=np.tanh(cint)
print(fnl)

1 个答案:

答案 0 :(得分:0)

如果您对学习线性回归感兴趣,那么有很多很棒的资源。这是一篇简单的博客文章,我从中了解到:https://medium.com/@gr33ndata/learn-regressions-analysis-23b789bf2c36