我有一个看起来像这样的数据框
我想使用“[ed”和区域使用“(”。)分割状态名称。我希望有一个包含两列(状态和区域)的数据框。这是我到目前为止我的代码所得到的。
ut=pd.read_table(r'university_towns.txt', header=None)
ut.head(50)
a=[]
f=lambda x:x.split('[edit]')[0]
g=lambda x:x.split(' (')[0]
for j,i in ut.iterrows():
if "[" in i:
State=i.apply(f,0)
else:
RegionName=i.apply(g,0)
a.append([State, RegionName])
x=pd.DataFrame(a, columns=["State", 'RegionName'])