在 R 中导入 ~3400 CSV 文件时无用的警告()和问题()

Unhelpful warnings() and problems() when importing ~3400 CSV files in R

提问人:meka 提问时间:4/22/2023 更新时间:4/22/2023 访问量:262

问:

我正在循环中使用 read_csv 读取目录中的所有 CSV 文件,并将每个文件重新绑定到主数据帧,这样做后,我看到有 13 个警告。

运行 warnings() 就像它说的那样,发出相同的警告消息 13 次。

> warnings()
Warning messages:
1: One or more parsing issues, call `problems()` on your data frame for details, e.g.:
  dat <- vroom(...)
  problems(dat)
2: One or more parsing issues, call `problems()` on your data frame for details, e.g.:
  dat <- vroom(...)
  problems(dat)
3: One or more parsing issues, call `problems()` on your data frame for details, e.g.:
  dat <- vroom(...)
  problems(dat)

然后我运行 problems() 并得到这个(我不知道该怎么做)

> problems(genomic_db)
# A tibble: 0 × 5
# … with 5 variables: row <int>, col <int>, expected <chr>, actual <chr>, file <chr>
# ℹ Use `colnames()` to see all variable names

然后运行 colnames 会为我提供所有预期的 DataFrame 列名。我对如何解决此问题感到茫然。

R 警告

评论

3赞 r2evans 4/22/2023
当您在循环中加载所有文件时,您是否在函数调用后对帧执行任何操作?如果附加到帧的属性在任何后续处理中丢失,我不会感到惊讶。read_*vroom
0赞 jay.sf 4/22/2023
已经尝试过原版了吗?read.csv()
0赞 L Tyrone 4/22/2023
您是否在 中明确定义了分隔符?您是否 100% 确信您的数据是“干净的”?可能是由于字符错误,某些列被转换为错误的类型。也可能存在杂散分隔符,并且列被“碰撞”在一起。一种检查方法是遍历您的文件,而不重新绑定它们。然后,您至少会看到所有文件是否都以相同的方式解释。vroom()print(str(yourfile))

答: 暂无答案