R 随机森林模型:生成混淆矩阵时出现问题

R Random Forest Model: Issue with Generating Confusion Matrix

提问人:Doc.s 提问时间:11/7/2023 更新时间:11/7/2023 访问量:19

问:

当我可以尝试为我的随机森林模型生成混淆矩阵时,我收到以下错误: 错误 !all.equal(nrow(data), ncol(data)) : 无效的参数类型

这是我使用的代码:

`ind <- sample(2, nrow(completeData), replace = TRUE, prob = c(0.7, 0.3))
trainData <- completeData[ind == 1, ]
testData <- completeData[ind == 2, ]

rf1 <- randomForest(price~., data = trainData)
print(rf1)

#Random Forest Model
p1 <- predict(rf1, newdata = testData)
testData$p1 <- p1

#Confusion matrix 
confusionMatrix(table(testData$price, testData$p1))`
R 机器学习 随机森林

评论


答:

0赞 I_O 11/7/2023 #1

price因此,可能是连续数据,而使用分类数据。p1confusionMatrixfactor

您可以将连续数据分类并运行类似操作(根据实际价格范围调整中断):cutconfusionMatrix

confusionMatrix(table(cut(testData$price, breaks = 0:10),
                      cut(testData$p1, breaks = 0:10)
                      )
                )

...但是,为什么要降级连续数据而不是在连续级别(散点图、相关性等)上进行检查呢?