问：

我正在使用 Bradley-Terry 模型对网球比赛的结果进行建模，并遇到了以下错误。当我运行时：

library(BradleyTerry2)

matches <- read.csv("data/matches.csv")
model <- BTm(cbind(wins1,
                   wins2),
             player1, player2, data=matches)
model

我收到错误消息：

Error in Diff(player1, player2, formula, id, data, separate.ability, refcat,  : 
  'player1$..' and 'player2$..' must be factors with the same levels

数据帧“matches”具有此格式（小型可重现示例）。

玩家 1	玩家2	胜利1	胜利2
阿加西	费德勒	0	6
阿加西	休伊特	1	0
阿加西	罗迪克	1	0
费德勒	亨曼	3	1
费德勒	休伊特	9	0
费德勒	罗迪克	5	0
亨曼	休伊特	0	2
亨曼	罗迪克	1	1
休伊特	罗迪克	3	2

...等等。出现在 player1 中的任何名称都将出现在 player2 中。

我不明白为什么 player1 和 player2 的因子有不同的级别？我尝试将它们设置为使用，但这不起作用。我还尝试删除和使用等作为函数的参数，但这也不起作用。现在我有点卡住了，所以欢迎任何想法！谢谢:)as.factordata=matchesmatches$wins1BTm

R 因子

lvls <- matches[1:2] |> unlist() |> as.character() |> unique()
matches[1:2] <- lapply(matches[1:2], factor, levels = lvls)

# check that now "Rafael Nadal" is always value 2
lapply(matches[1:2], unclass)
#> $player1
#> [1] 1 1 2
#> attr(,"levels")
#> [1] "Roger Federer" "Rafael Nadal"  "Andy Murray"  
#> 
#> $player2
#> [1] 2 3 3
#> attr(,"levels")
#> [1] "Roger Federer" "Rafael Nadal"  "Andy Murray"

^{创建于 2023-11-14}

数据

matches <- structure(list(
  player1 = structure(c(2L, 2L, 1L), levels = c("Rafael Nadal", "Roger Federer"), class = "factor"), 
  player2 = structure(c(2L, 1L, 1L), levels = c("Andy Murray", "Rafael Nadal"), class = "factor"), 
  wins1 = c(3L, 5L, 4L), wins2 = c(2L, 2L, 3L)), 
  class = "data.frame", row.names = c(NA, -3L))

^{创建于 2023-11-14}

编辑

同时，问题中的示例数据集已更改。除了对球员姓名的引用外，上面的代码仍然有效并解决了问题。

0赞 Ollie 11/15/2023 #2

在原始帖子评论的大力帮助下，它现在已经解决了......只需要确保 players1 和 players2 列只包含相同的玩家（这可能意味着在数据文件中切换某个回合），然后使用 around 和 .as.factor()player1player2

上一个：如何比较分类响应变量的连续数据？

下一个：如何根据 R 中其他因子列的信息创建新列？

因素有不同的层次，但我不明白为什么

Factors have different levels but I don't understand why

评论

数据

编辑