使用逻辑回归进行探索性分析 - 是否需要拆分为训练集和测试集?

Exploratory analysis with logistic regression - Do I need to split into training and test sets?

提问人:inprogress123 提问时间:11/5/2023 更新时间:11/5/2023 访问量:17

问:

我有一个数据集,我目前正在探索。我感兴趣的一件事是某些变量是否对特定的结果测量进行分类。我想使用逻辑回归来看看它的表现如何。在这种情况下,是否可以只使用整个数据集进行训练,然后进行预测(请参阅下面的代码),或者甚至在这个探索阶段,我是否应该拆分为训练集和测试集?

    model_glm = glm(outcome ~ var1 + var2, data = DataSet, family = "binomial")
    prob = predict(model_glm, newdata = DataSet, type = "response")
    roc = roc(DataSet$outcome ~ prob, plot = TRUE, print.auc = TRUE)
    as.numeric(roc$auc)
    coords(roc, "best")

我尝试将数据集拆分为训练集和测试集以及上面的代码。我的结果也差不多。

机器学习 逻辑 回归 训练 - 数据 探索 - 数据分析

评论


答: 暂无答案