如何使用mask命令包含多个参数?

时间:2019-10-02 13:42:39

标签: python pandas dfply

我目前正在做一个机器学习项目(一个非常基本的项目),并使用1871-2015年的棒球数据。我想用一组特定的年份来检验我的预测。我正在使用dfply软件包,然后使用mask命令取出某年,但是我需要取出的不仅仅是一年。我该怎么办?

先谢谢您。

我尝试使用“或”和“ |”以及添加()和[]。

import pandas as pd

import numpy as np 

import sklearn

from sklearn import linear_model

from sklearn.utils import shuffle

import matplotlib.pyplot as pyplot

import pickle 

from matplotlib import style

from dfply import *

import statsmodels.api as sm

import statsmodels.formula.api as smf

data = pd.read_csv("team.csv")

data_test = (data >>  mask(X.year == 1997))

我希望X.year是1997-2015年。

1 个答案:

答案 0 :(得分:0)

假设您的year中有一列pandas.DataFrame,这应该可以工作:

data_test = data[data.year == 1997]