如何灵活地为 pmap() 的 .l 提供不同长度的参数

How to flexibly supply a varying length argument to .l of pmap()

提问人:Joe 提问时间:11/5/2023 更新时间:11/5/2023 访问量:24

问:

下面是一个操作,要求我的数据采用宽格式。我每天执行一些模拟,并将每个模拟的最大值捕获为 。pmap()post_max

library(tidyverse)

POST_SIMS <- 2
CONDITIONS <- 3
DURATION <- 2

df <-
    tibble(
        day = rep(1:DURATION, each = CONDITIONS),
        condition = rep(LETTERS[1:CONDITIONS], times = DURATION)
    ) |>
    rowwise() |>
    mutate(post = list(rnorm(POST_SIMS, 0, 1))) |>
    ungroup()

df_wide <- df |> 
    pivot_wider(
        id_cols = c(day), 
        names_from = "condition",
        values_from = 'post'
    ) 

df_wide |> 
    mutate(
        post_max = 
            pmap(
                .l = list(A,B,C), # This works, but needs manual updating
                .f = pmax)
    ) |> 
    unnest()

问题是,当我达到时,我必须每年列出一次独特的条件,这是不可取的,因为我的目标是编写一个可以容纳任意数量条件的模拟函数。pmap(list(A,B,C), pmax)

有没有办法捕获其中生成的独特条件并将其作为 pmap() 的参数提供,因为我在下面尝试但失败了?df

my_conditions <- noquote(unique(df$condition)) 

df_wide |> 
    mutate(
        post_max = 
            pmap(
                .l = list(my_conditions), # How do I do this part? 
                .f = pmax)
    ) |> 
    unnest()

提供给的论点让我有点困惑。这显然不是一个字符串。我把它写成 ,这通常很方便,但掩盖了摄取的内容。我假设我正在处理某种整洁的计算,但是这个参数长度的灵活性与我典型的整洁的评估应用程序不同,在应用程序中,我只是将我的列命名为 quosures。.llist().l = list(A,B,C)pmap()

R 列表 整洁 的 pmap

评论


答:

1赞 margusl 11/5/2023 #1

list(A,B,C)在这种情况下,只需从参数()中选择列,&列,将它们添加到列表中基本上会生成类似Tibble的结构。尝试替换为 :ABCmutate().datadf_widelist(A,B,C)pick(-day)

glimpse(df_wide)
#> Rows: 2
#> Columns: 4
#> $ day <int> 1, 2
#> $ A   <list> <-1.4857029, -0.2090127>, <-1.6142362, 0.2935161>
#> $ B   <list> <2.610475, -1.604595>, <-1.455556395, 0.003465559>
#> $ C   <list> <-0.06067370, 0.09182582>, <-0.5745877, -1.0695619>

df_wide |> 
  mutate(
    post_max = 
      pmap(
        .l = pick(-day),
        .f = pmax)
  ) |> 
  unnest()
#> Warning: `cols` is now required when using `unnest()`.
#> ℹ Please use `cols = c(A, B, C, post_max)`.
#> # A tibble: 4 × 5
#>     day      A        B       C post_max
#>   <int>  <dbl>    <dbl>   <dbl>    <dbl>
#> 1     1 -1.49   2.61    -0.0607   2.61  
#> 2     1 -0.209 -1.60     0.0918   0.0918
#> 3     2 -1.61  -1.46    -0.575   -0.575 
#> 4     2  0.294  0.00347 -1.07     0.294

rowwise() + max(c_across())应该提供相同的结果,尽管我想它更容易遵循:

df_wide |> 
  unnest_longer(-day) |>
  rowwise() |>
  mutate(post_max = max(c_across(-day))) |>
  ungroup()