我处理正则表达式时遇到了困难。
这是我正在处理的数据框架。 这是来自kaggle的数据 (url ='https://www.kaggle.com/c/pkdd-15-predict-taxi-service-trajectory-i') 我想要做的是分隔每一行的每个[经度,纬度]并使用它的每个单位。
例如,对于每一行
long& lat = [long0,lat0],[,],[,],[,] ,,,,,, [long n,lat n]
要么
long& lat =
我想提取每个单位
long& lat [0] = [long0,lat0]
要么
long& lat [0] = long0,lat0如果可能的话
我该如何处理?
我尝试了其他类似的方法。
df_concat['POLYLINE'][0].str.split(',')[0]
df_concat['POLYLINE'][:3].apply(pd.Series)
但是找不到怎么做。
答案 0 :(得分:0)
考虑这个虚拟df
long&lat
0 [100, 50]
1 [200, 150]
您可以使用
获取lat和long值df['long'] = df['long&lat'].apply(lambda x: x[0])
df['lat'] = df['long&lat'].apply(lambda x: x[1])
或者只是
df[['long', 'lat']]=df['long&lat'].apply(pd.Series)
你得到了
long&lat long lat
0 [100, 50] 100 50
1 [200, 150] 200 150