Python中多级变量的逻辑回归

时间:2021-05-01 18:09:38

标签: python pandas dataset logistic-regression

目前我正在处理这个数据集:kagle dataset

我想检查每个产品在工作日和季节销售的概率。但是我知道如何开始它,因为工作日有 7 个级别,季节有 4 个级别(春季、夏季、春季和冬季)。我只有一些经验,将线性回归更改为逻辑回归,我需要从 0 到 1 的值。

我刚刚开始加载数据:

import pandas as pd
from google.colab import drive
drive.mount('/content/drive')
path = 'drive/My Drive/Colab Notebooks/LogisticRegression/'
import sklearn
dataset = pd.read_csv(path + 'Groceries_dataset.csv', header = 0)

def convert_date_to_weekday(date_string):
  # convert string to date object
  date_object = datetime.strptime(date_string, '%d-%m-%Y').date()
  # convert date object to weekday string
  return date_object.strftime("%A")
  
dataset['Weekday'] = dataset['Date'].apply(lambda x: convert_date_to_weekday(x))

我不打算强迫别人为我做那个。我只是在寻找一种正确的方法如何“潜入”并更好地理解逐步

0 个答案:

没有答案