我正在this数据集中工作,我想基于此将yr_built和yr_renovated合并为一个,最好合并为yr_built:如果yr_renovated中的值大于0,那么我希望拥有这个值,否则为yr_built的值。
您能帮我吗?
谢谢!
答案 0 :(得分:0)
您在这里。基本上,数据框需要熊猫,然后使用numpy创建新列以检查'yr_renovated'
的值是否大于零,否则使用'yr_built'
import pandas as pd
import numpy as np
df = pd.read_csv('https://raw.githubusercontent.com/Jonasyao/Machine-Learning-Specialization-University-of-Washington-/master/Regression/Assignment_four/kc_house_data.csv', error_bad_lines=False)
df=df[['yr_built','yr_renovated','date','bedrooms']]
newdata['MyYear']=np.where(df['yr_renovated'] > 0,df['yr_renovated'],df['yr_built'])
newdata