我目前正在做一个机器学习项目(一个非常基本的项目),并使用1871-2015年的棒球数据。我想用一组特定的年份来检验我的预测。我正在使用dfply软件包,然后使用mask命令取出某年,但是我需要取出的不仅仅是一年。我该怎么办?
先谢谢您。
我尝试使用“或”和“ |”以及添加()和[]。
import pandas as pd
import numpy as np
import sklearn
from sklearn import linear_model
from sklearn.utils import shuffle
import matplotlib.pyplot as pyplot
import pickle
from matplotlib import style
from dfply import *
import statsmodels.api as sm
import statsmodels.formula.api as smf
data = pd.read_csv("team.csv")
data_test = (data >> mask(X.year == 1997))
我希望X.year是1997-2015年。
答案 0 :(得分:0)
假设您的year
中有一列pandas.DataFrame
,这应该可以工作:
data_test = data[data.year == 1997]