h2o 和 coxph 现场 ERRR: _train:训练数据必须至少具有 2 个特征(包括响应)

h2o and coxph ERRR on field: _train: Training data must have at least 2 features (incl. response)

提问人:ilpadrino 提问时间:8/7/2023 更新时间:8/10/2023 访问量:20

问:

我正在尝试使用 h2o 构建 Cox 比例风险模型。事实上,我已经成功地建立了一个关于胃癌数据集中生存的深度学习模型。当尝试使用 h2o.coxph 执行此操作时,我总是得到“字段上的 ERRR:_train:训练数据必须至少具有 2 个特征(包括响应)”。我已经检查了我的数据序列帧是否具有“事件/响应”列(尝试使用因子/数字/整数,结果相同)。此外,我还尝试使用发明的 10 个观测数据集,其中包括“起始列(全部为零)、停止列(随机>0)、事件列(随机 (0,1))和一个预测变量(例如:age (random>20),结果相同。

但是当我导入“帮助部分”下建议的数据(csv 文件)并检查开始、停止和事件列的数据类型时,与我拥有的数据类型相似,但在这种情况下,我可以构建模型。我不知道问题出在哪里。

有什么建议吗??

这是我的代码:

h2o.init()

#Load data into the cluster
datos_h2o<-as.h2o(prueba_2)

#Build the model
modelo_coxph <- h2o.coxph(x = "edad", training_frame = datos_h2o,
                         event_column = "event",
                         start_column= "inicio",
                         stop_column = "final"
                        )

提前致谢

R H2O

评论


答:

0赞 ilpadrino 8/10/2023 #1

解决。如果我省略“开始列”,它就可以工作。我不知道为什么,因为认为这一列代表观测值的开始时间,这意味着它可以有零值,但不能。