我正在尝试使用由值组成的另一个数据框创建一个新的数据框

时间:2018-09-27 06:58:15

标签: python pandas

temp['DateTime']= Total_12hravg_all[index_end, 'DateTime']

temp是一个新的数据框

Total_12hravg_all是一个我想要使用index_end作为变量的列行的特定值的数据帧。 DatetimeTotal_12hravg_all中的一列,在dataframe中作为索引出现,我实际上需要DateTime值。

但是出现语法错误。

1 个答案:

答案 0 :(得分:1)

示例:感兴趣的列是company_id(字符串)和company_score(浮动)。

因此,您可以使用groupby company_id 列并将其结果转换为DataFrames字典:

>>> import pandas as pd
>>> df = pd.DataFrame({
...     "company_id": ["AA", "AB", "AA", "CD", "AB"],
...     "company_score": [.07, .08, .06, .0003, .09],
...     "company_region": ["NW", "NE", "NW", "NW", "NE"]})
>>> df
  company_id company_region  company_score
0         AA             NW         0.0700
1         AB             NE         0.0800
2         AA             NW         0.0600
3         CD             NW         0.0003
4         AB             NE         0.0900
>>> dict_of_companies = {k: v for k, v in df.groupby('company_id')}

>>> import pprint
>>> pprint.pprint(dict_of_companies)
{'AA':   company_id company_region  company_score
0         AA             NW           0.07
2         AA             NW           0.06,
 'AB':   company_id company_region  company_score
1         AB             NE           0.08
4         AB             NE           0.09,
 'CD':   company_id company_region  company_score
3         CD             NW         0.0003}
>>>