我正在尝试查找Spark 2.3 Logistic回归系数的p值。具体来说,如果我这样做:
lr = LogisticRegression(labelCol="clicks", featuresCol="features", maxIter=10,elasticNetParam=1)
# Train model with Training Data
lrModel = lr.fit(trainingData)
print(lrModel.coefficients) #get coefficients
将返回系数值的列表,但没有p值或置信区间。我在文档(https://spark.apache.org/docs/latest/api/python/pyspark.ml.html)中找不到可以找到系数的p值的地方。
Similir问题不能满足我的需求:
How to calculate p-values in Spark's Logistic Regression? (这是Spark的旧版本,我无法确认它是否实际上返回了pvalue;还请注意,该函数不采用管道(例如,一个热编码管道等))