我正在分析一组包含许多列(近30列)的数据。我想基于两列对数据进行分组,并将sum和mean函数应用于除时间戳之外的所有列。 我如何在除时间戳之外的所有列上使用summarise_each?
这是我的草案代码,但显然不正确。此外,它还会生成错误,因为它无法将Sum应用于POSIXt数据类型(错误:'总和'未定义为" POSIXt"对象)
package/package.py
答案 0 :(得分:18)
尝试import re
s = "ABC12DEF3G56HIJ7"
pattern = re.compile(r'([A-Z]+)([0-9]+)')
for m in re.finditer(pattern, s):
print m.group(2), '*', m.group(1)
从摘要中排除summarise_each(funs(mean,sum), -TIMESTAMP)
。