我在数据框中有一列,即Pclass,其类号为1 2 3 p类 1个 2 3 1个 我使用get_dummies对pclass进行了虚拟化,并获得了该值 pclass class_1 class_2 Class_3 1 1 0 0 2 0 1 0 3 0 0 1 1 1 0 0
现在我要计算class_1和class_2的平均值。
答案 0 :(得分:0)
如果我做对了,您想计算两列值的平均值。
如果要使用内置函数,可以这样操作:
SELECT DISTINCT
vf.id,
vf.title,
vf.filename
FROM video_files vf
WHERE vf.id IN
(
SELECT vf.id
FROM video_files vf
JOIN tags_map tm
ON tm.video_file_id = vf.id
AND tm.tag_id IN (1,2)
GROUP BY vf.id
HAVING count(tm.tag_id) >= 2
EXCEPT
SELECT vf.id
FROM video_files vf
JOIN tags_map tm
ON tm.video_file_id = vf.id
AND tm.tag_id IN (3,4)
)
或者将两列作为列表并自己计算:
df['Pclass_1'].append(df['Pclass_2']).mean()