flight_time
11:42:00
19:37:06
18:11:17
我在使用数据集中的播放时间变量时遇到问题。我似乎无法弄清楚如何让R将此值视为数值。
如果之前有人问过,请道歉。
编辑:
好的,鉴于下面发布的内容我已经意识到有一些事我以前不知道/检查过。
首先,这是一个因子变量。我阅读了lubridate包文档,因为我想执行算术运算(如果这是正确的术语),我相信持续时间函数是正确的。
然而,看一下这些示例 - 我不完全确定将此应用于大型(ish)数据中的整列的语法是什么。由于我有4.5k的观测值,我不确定如何使用它。我不需要过多的粒度 - 理想情况下甚至小时和分钟都可以。
所以我想我希望我的代码看起来像:
从因子变量到字符串的转换>从字符串转换为duration / as.numeric。
答案 0 :(得分:4)
试试这段代码:
import re
s = "bad bad keyword1 GOOD DATA " \
"keyword2 bad bad bad bad " \
"keyword1 MORE GOOD DATA " \
"keyword2 bad bad"
for i in re.findall('keyword1(.*?)keyword2', s, re.DOTALL):
print(i)