连接列对象,缺少零

时间:2018-10-09 19:46:37

标签: python pandas

我正在尝试连接两列-小时(hh)和分钟(mm)列。一些值是双零。当我连接小时和分钟列时,不包括小时列。任何帮助将不胜感激。

import pandas as pd
from urllib.request import urlopen
import datetime as dt

url = "https://www.ndbc.noaa.gov/view_text_file.php?filename=42887h2014.txt.gz&dir=data/historical/stdmet/"
data_csv = urlopen(url)
df = pd.read_csv(data_csv, delim_whitespace=True, index_col=0, parse_dates=True)

#Reset Index + remove first row + rename column
df.reset_index(level=0, inplace=True)
df = df.iloc[1:]
df = df.rename(columns={'#YY': 'YY'})

df['Time'] = df[df.columns[3:5]].apply(lambda x: ':'.join(x.dropna().astype(int).astype(str)),axis=1)

结果:

Out[203]: 
1          0:0
2         0:20
3         0:40
4          1:0
5         1:20

应为:

Out[203]: 
1         00:00
2         00:20
3         00:40
4         01:00
5         01:20

1 个答案:

答案 0 :(得分:1)

您可以使用str.cat,而无需使用apply

df[df.columns[4]].str.cat(df[df.columns[5]], sep=':')