目前我正在处理这个数据集:kagle dataset
我想检查每个产品在工作日和季节销售的概率。但是我知道如何开始它,因为工作日有 7 个级别,季节有 4 个级别(春季、夏季、春季和冬季)。我只有一些经验,将线性回归更改为逻辑回归,我需要从 0 到 1 的值。
我刚刚开始加载数据:
import pandas as pd
from google.colab import drive
drive.mount('/content/drive')
path = 'drive/My Drive/Colab Notebooks/LogisticRegression/'
import sklearn
dataset = pd.read_csv(path + 'Groceries_dataset.csv', header = 0)
def convert_date_to_weekday(date_string):
# convert string to date object
date_object = datetime.strptime(date_string, '%d-%m-%Y').date()
# convert date object to weekday string
return date_object.strftime("%A")
dataset['Weekday'] = dataset['Date'].apply(lambda x: convert_date_to_weekday(x))
我不打算强迫别人为我做那个。我只是在寻找一种正确的方法如何“潜入”并更好地理解逐步