我正在处理一个csv表,其中包含来自啤酒厂的数据,例如所需数据,数量顺序等。
我想编写一个模块来读取csv文件结构并将数据加载到合适的数据结构中 在Python中。我必须通过计算平均增长率来解释数据, 不同的啤酒,并使用这些值来预测未来一周或一个月的销售量。
我不知道从哪里开始。到目前为止,我仅有的一行代码是:
df = pd.read_csv (r'file location')
print (df)
答案 0 :(得分:0)
为了说明这一点,我下载了有关美国就业水平(https://fred.stlouisfed.org/series/CE16OV)和人口(https://fred.stlouisfed.org/series/POP)的数据。
import pandas as pd
employ = pd.read_csv('/home/brb/bugs/data/CE16OV.csv')
employ = employ.rename(columns={'DATE':'date'})
employ = employ.rename(columns={'CE16OV':'employ'})
employ = employ[employ['date']>='1952-01-01']
pop = pd.read_csv('/home/brb/bugs/data/POP.csv')
pop = pop.rename(columns={'DATE':'date'})
pop = pop.rename(columns={'POP':'pop'})
pop = pop[pop['date']<='2019-10-01']
df = pd.merge(employ,pop)
df['employ_monthly'] = df['employ'].pct_change()
df['employ_yoy'] = df['employ'].pct_change(periods=12)
df['employ_pop'] = df['employ']/df['pop']
df.head()