提问人:Paul Fabian 提问时间:9/27/2023 最后编辑:Paul Fabian 更新时间:9/28/2023 访问量:47
在交互作用上使用 weightthem - ebal(R 统计)作为治疗是否可行?
Is it feasible to use weightthem - ebal (R statistics) on an interaction as a Treatment?
问:
我试图找出在给定学校类型中接受治疗的学生与在任何其他学校类型中接受治疗的学生之间的结果是否存在差异。
我之前使用 PSM 来查找治疗对结果的影响 - 但由于治疗组(给定接受治疗的学校类型)变得很小并且非常特殊(关于协变量),我想知道我是否可以在 R 的 weightthem-package 中使用熵平衡(因为我也使用 MI 来处理缺失值)。首先,我考虑使用简化的数据集(仅处理所有学校类型),但在那里我既没有通过 PSM 实现平衡,也没有收敛 ebal 加权。一种可能性是减少协变量的数量以增加重叠,但条件独立性假设可能会有问题。
所以现在我使用的是完整的数据集(大多数学生没有得到治疗)。
我的看法是
weighted_data <- weightthem(Given-schooltype*Treatment ~ X1 + X2+ X3+ Xn, imputed.data, approach = “within”, method = “ebal”, estimand = “ATT”)。
到目前为止,我的问题: 尝试在交互时刻平衡数据集是否有意义? 后续分析会是什么样子?我正在考虑结果的回归~给定学校类型+治疗+给定学校类型*治疗(也许还有进一步的控制?
提前致谢!
编辑:治疗是二进制的(0/1),given-schooltype也是一个二进制的虚拟(0/1)。
编辑2(回复/澄清/回答): 嘿,谢谢你的回复!您的回答(和问题)已经帮助我澄清了一些事情! 按照你的写法,我看到为了回答我的 RQ,我应该使用仅包含处理单位(给定类型 x 处理)和未处理单位(其他类型 x 处理)的样本,因为我正在寻找 ATT。所以我只有二元治疗。 我可能会找到足够的平衡,因为如前所述,给定学校类型的学生或多或少享有特权。因此,我可能无法按照我想要的方式进行分析。对于我的论文来说,这将是相当灾难性的,但就其本身而言,这将是一个有趣的发现,我将进一步研究。
我尝试了不同的方法(PSM,基因匹配;ebal)。实际上,之后的平衡还不错,但我的有效样本量变得非常小,所以我不想在这些样本中得出推论。我将按照您的建议尝试进一步的方法:)
与我一起智囊团的同事(实际上我也相信在统计分析方面有一些基础知识)建议只对具有主效应(学校类型、治疗)、交互作用项(学校类型*治疗)和控制变量(本来用于加权)的完整样本进行回归分析。但我不认为这是最好的方法(甚至不是一个合理的方法,因为我的大部分样本都没有接受治疗(但参加了给定的学校类型))。
进一步需要注意的是,我使用非实验纵向数据,因此我有治疗的预处理值(但不是给定学校类型的录取值 - 这些我只能近似,但还不错)。
答:
听起来你有一个 4 分类处理,你可以使用它与熵平衡一起使用(是背后的引擎,包含所有关于可能的事情的文档; 仅在每个插补数据集上运行)。只需创建 4 类变量,并在模型公式中将其作为处理提供。weightit()
weightit()
weightthem()
weightthem()
weightit()
我还看到你似乎只关心比较两组学生;在一种学校类型接受治疗的人和在另一种学校类型接受治疗的人。那么你真的有 4 类治疗,还是只有 2 类治疗?未经治疗的学生应该如何进入此分析?
熵平衡将每个组加权以类似于目标。默认情况下,它会对每个组进行加权,使其类似于完整样本。您希望每个组都类似于完整样本、仅处理过的单位,还是仅类似于 4 个类别中的一个?你需要做出决定。它可能会对你实现平衡的能力、估计的效果及其解释产生重大影响。这由参数和示例中包含的单位控制。estimand
如果由于平衡约束太严格而导致熵平衡失败,则只需使用其他方法即可。 还有其他几种方法可能适用于您的数据集。您是否尝试过倾向得分加权?你试过CBPS吗?你试过能量平衡吗?如果没有方法可以平衡你的数据集,那么它可能就无法平衡,并且你拥有根本上无法比拟的组。那你会怎么做?weightit()
评论