将经过时间的变量转化为可管理的事物

时间:2015-05-20 20:53:23

标签: r

flight_time
    11:42:00
    19:37:06
    18:11:17

我在使用数据集中的播放时间变量时遇到问题。我似乎无法弄清楚如何让R将此值视为数值。

如果之前有人问过,请道歉。

编辑:

好的,鉴于下面发布的内容我已经意识到有一些事我以前不知道/检查过。

首先,这是一个因子变量。我阅读了lubridate包文档,因为我想执行算术运算(如果这是正确的术语),我相信持续时间函数是正确的。

然而,看一下这些示例 - 我不完全确定将此应用于大型(ish)数据中的整列的语法是什么。由于我有4.5k的观测值,我不确定如何使用它。我不需要过多的粒度 - 理想情况下甚至小时和分钟都可以。

所以我想我希望我的代码看起来像:

从因子变量到字符串的转换>从字符串转换为duration / as.numeric。

1 个答案:

答案 0 :(得分:4)

试试这段代码:

import re

s = "bad bad keyword1 GOOD DATA " \
    "keyword2 bad bad bad bad " \
    "keyword1 MORE GOOD DATA " \
    "keyword2 bad bad"

for i in re.findall('keyword1(.*?)keyword2', s, re.DOTALL):
    print(i)