如何将大数据集拆分为训练集,验证集和测试集

时间:2018-04-20 08:37:42

标签: python

我有一个包含30个类的数据集,每个类都有不同的idx。我想在python中将这个数据集分别分为70%,20%和10%,训练,验证和测试集。能告诉我一个如何编写代码的建议吗?我是新来的。

2 个答案:

答案 0 :(得分:1)

你可以使用scikitlearn

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.80, random_state=42)

然后再次拆分火车以创建验证

答案 1 :(得分:0)

下面的代码为训练,开发和测试集产生了60%,20%,20%的比例。

将numpy导入为np

    public void InstagramLogin()
    {
        Driver.FindElement(By.XPath("//button[@class='uppy-DashboardTab-btn']//div[contains(text(), 'Instagram')]")).Click();
        Driver.FindElement(By.XPath("//button[contains(text(), 'Connect to Instagram')]")).Click();
        Driver.SwitchToPopup();
        Driver.WaitForElementDisplayed_byXPath("//input[@name='username']"));
        Driver.FindElement(By.XPath("//input[@name='username']")).SendKeys("MyEmail@gmail.com");
        Driver.FindElement(By.XPath("//input[@name='password']")).SendKeys("myPassword");
        Driver.FindElement(By.XPath("//button[@type='submit']")).Click();
        Driver.WaitForElementDisplayed(By.XPath("//button[text()='Not Now']"));
        Driver.FindElement(By.XPath("//button[text()='Not Now']").Click();
        bool ele = Driver.IsElementPresent(By.XPath("//button[contains(text(), 'Continue')]"));
        if (ele)
        {
            Driver.FindElement(By.XPath("//button[contains(text(), 'Continue')]")).Click();
            Driver.WaitForElementNoLongerDisplayed_byXPath("//button[contains(text(), 'Continue')]");
        }
        Driver.GoToMainHandle();
    }