我编写了一个小脚本,用于分析.csv文件,并将价格列和平方英尺列转换为2个列表。
我想找到一种获取与两个列表相关的单个值的方法。我需要价值来预测平方英尺金额的未来价格。有没有办法做到这一点。我听说过linreg,但我不知道如何使用它。另外,在我的代码中我获得了一个值,但它是两个值,我做错了什么?我该怎么做?
filename = 'C:/Users/saeed/Downloads/Sacramentorealestatetransactions.csv'
df = pandas.read_csv(filename)
print(tabulate(df, headers='keys', tablefmt='psql'))
with open(filename) as i:
sqft = [int(row["sq__ft"]) for row in DictReader(i)]
with open(filename) as i:
price = [int(row["price"]) for row in DictReader(i)]
df[df['sq__ft'] != 0]
print(sqft)
print(price)
from scipy import stats
corr = stats.pearsonr(sqft, price)
print(corr)
z = np.arctanh(corr[0])
print(z)
sigma = (1/((len(df.index)-3)**0.5))
print(sigma)
cint = z + np.array([-1, 1]) * sigma * stats.norm.ppf((1+0.95)/2)
fnl=np.tanh(cint)
print(fnl)
答案 0 :(得分:0)
如果您对学习线性回归感兴趣,那么有很多很棒的资源。这是一篇简单的博客文章,我从中了解到:https://medium.com/@gr33ndata/learn-regressions-analysis-23b789bf2c36